Zdroje dat-

Logy

Log (též žurnál) je název pro záznam nebo soubor záznamů (často soubory s příponou .log), které si některé programy vytvářejí pro ukládání informací o své činnosti a běhu. Logy slouží při zpětné analýze k rozpoznání, zda došlo k nějaké chybě a pakliže ano, pak pomáhají určit, k jaké chybě došlo a proč. Mohou také obsahovat informace o tom, jak a kým byla daná aplikace či služba využívána (například z jaké IP adresy bylo přistupováno k WWW serveru).

Data mining

Data mining ([dejta majnyn], angl. dolování z dat či vytěžování dat) je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Někdy se chápe jako analytická součást dobývání znalostí z databází (Knowledge Discovery in Databases, KDD), jindy se tato dvě označení chápou jako souznačná.

Honeypot

Honeypot (anglicky „hrnec medu“) je informační systém, jehož účelem je přitahovat potenciální útočníky a zaznamenat jejich činnost.

Metadata

Metadata (z řeckého meta- = mezi, za + latinského data = to, co je dáno) jsou strukturovaná data o datech. Příkladem je katalogizační lístek v knihovně, obsahující data o původu a umístění knihy: jsou to data o datech v knize, uložená na katalogizačním lístku. Metadata mohou sloužit např. k snadnému vyhledávání knih.

OLAP

OLAP (Online Analytical Processing) je technologie uložení dat v databázi, která umožňuje uspořádat velké objemy dat tak, aby byla data přístupná a srozumitelná uživatelům zabývajícím se analýzou obchodních trendů a výsledků (Business Intelligence). Způsob uložení dat se svým zaměřením liší od běžněji užívaného OLTP (Online Transaction Processing), kde je důraz kladen především na snadné a bezpečné ukládání změn v datech v konkurenčním (víceuživatelském) prostředí.

Big Data

Big data je pojem z výpočetní techniky. Přímý překlad tohoto pojmu z angličtiny do češtiny je veledata. V dostupných zdrojích je uváděno více definic. Například poradenská firma Gartner za big data označuje soubory dat, jejichž velikost je mimo schopnosti zachycovat, spravovat a zpracovávat data běžně používanými softwarovými prostředky v rozumném čase. Často bývá v textech na dané téma používáno i v češtině přímo big data jako pojem označující technickou kategorii, tedy bez překladu.

Strojové učení

Strojové učení je podoblastí umělé inteligence, zabývající se algoritmy a technikami, které umožňují počítačovému systému 'učit se'. Učením v daném kontextu rozumíme takovou změnu vnitřního stavu systému, která zefektivní schopnost přizpůsobení se změnám okolního prostředí. Strojové učení se značně prolíná s oblastmi statistiky a dobývaní znalostí a má široké uplatnění. Jeho techniky se využívají např. v biomedicínské informatice (tzv. systémy pro podporu rozhodování), rozlišení nelegálního užití kreditních karet, rozpoznávání řeči a psaného textu, či mnohé další. Algoritmy však mohou být tendenční.