Základy analýzy intelektuálních dat: technologie, metody a úkoly

Používání údajů je problém při vývoji programů a při vývoji informačních systémů. Před analýzou velkého množství dat a rozhodnutím, které zaručuje spolehlivý a objektivní výsledek, je nutné určit tento velký objem. Úloha je komplikovaná, pokud se tok informací rychle zvyšuje a čas pro rozhodnutí je omezen.

Data a jejich formalizace

Moderní informační technologie poskytují bezpečnou a spolehlivou analýzu, prezentaci a zpracování dat. Syntakticky a formálně je to pravda. Z hlediska sémantiky úkolu a objektivity očekávaného řešení závisí výsledek na zkušenostech, znalostech a dovednostech programátora. Programovací jazyky jsou ve stavu spolehlivého a bezpečného nástroje. Znalosti a dovednosti odborníků, kteří analyzují, reprezentují a zpracovávají data, přicházejí na úroveň relativní univerzality.


Technologie analýzy intelektuálních dat na této úrovni je prakticky bezvadná. Typy dat mohou být známy před operací na nich a v případě nedodržení - budou automaticky přeneseny do požadovaného typu.
Vyvíjí se hypertextové nástroje, široce se používá distribuované distribuované zpracování velkých objemů dat. Na této úrovni:
  • informační úkoly podléhají formalizaci;
  • jsou splněny potřeby intelektuální analýzy;
  • Kvalita výsledku závisí na kvalitě znalostí a profesionalitě programátora.
  • Situace v programování informacíSystémy podnikové úrovně jsou charakterizovány přítomností opravdu fungujících produktů, které zajišťují tvorbu velkých objemů dat a problém vyššího řádu.


    Velké objemy dat

    V 80. letech, kdy se databáze staly systémy správy databáze, se zlepšila spolehlivost hardwaru a kvalita programovacích jazyků byla velmi žádoucí. Bylo nahromaděno velké množství databází, mnoho počítačových zdrojů informací, komplexní systémy pro shromažďování různých informací (finance, počasí, statistiky, daně, nemovitosti, osobní údaje, klima, politika). Některé zdroje dat jsou charakterizovány zřejmými zákony a jsou předmětem analýzy matematickými metodami. Můžete provádět inteligentní analýzu dat v aplikaci Excel: jasné údaje, sestavení modelu, formulování hypotézy, určení korelace atd. Některá data a prameny práva jsou obtížně rozpoznatelné. Ve všech případech se software a hardware pro zpracování dat vyznačují spolehlivostí a stabilitou. Úloha inteligentní analýzy dat byla v čele rohu mnoha sociálně-ekonomických sfér.
    Vedoucí představitelé informačního průmyslu, zejména Oracle, zaměřují svou pozornost na řadu okolností, které charakterizují data nového typu:
  • obrovské toky;
  • přirozené informace (i když jsou naprogramovány);
  • heterogenní údaje;
  • nejvyšší kritéria odpovědnosti;
  • širokou škálu formátů reprezentace dat;
  • kompatibilita integrátorůdat a jejich zpracovatelů.
  • Hlavní charakteristika dat nového typu: obrovský objem a rychlost růstu tohoto objemu. Klasické algoritmy nejsou použitelné pro zpracování nových typů dat, a to ani při zohlednění rychlosti moderních počítačů a použití paralelních technologií.

    Ze zálohování na migraci a integraci

    Dříve bylo úkolem bezpečného ukládání informací (zálohování, zálohování) naléhavé. Dnes je skutečný problém migrace více reprezentací dat (různých formátů a kódování) a jejich integrace do jednoho celku.
    Bez technologie inteligentní analýzy dat nelze vyřešit mnoho problémů. Zde nehovoříme o rozhodování, určování závislostí, vytváření algoritmů pro vzorové objemy dat pro další zpracování. Sloučení heterogenních dat se stalo problémem a není možné přenést zdroje informací na jediný formalizovaný základ. Inteligentní analýza velkého množství dat vyžaduje definici tohoto objemu a tvorbu technologií (algoritmus, heuristika, sady pravidel), aby získali příležitost dát úkol a vyřešit.

    Dolování dat: kopání

    Pojem analýzy dat v kontextu intelektuálních metod se aktivně rozvíjí od počátku 90. let minulého století. Umělá inteligence dosud neplnila očekávání, ale potřebná informovaná rozhodnutí založená na analýze informací se neustále zvyšuje. Strojové učení, inteligentní analýza dat, rozpoznávání obrazu, vizualizace, teorie databází, algoritmizace, statistiky,matematické metody byly spektrem úkolů nového, aktivně se rozvíjejícího oboru znalostí, který je spojen s anglicky mluvícími minigeny.
    V praxi se nová oblast znalostí stala interdisciplinární a je v procesu stávání. Díky zkušenostem a softwarovým produktům společnosti Oracle, Microsoft, IBM a ostatních vedoucích společností existuje jasný názor na takovou inteligentní analýzu dat, ale stále existuje spousta otázek. Stačí říci, že řada softwarových produktů Oracle věnovaná mimořádně velkým objemům informací, jejich integraci, kompatibilitě, migraci a zpracování je více než čtyřicet pozic! Co potřebujete k tomu, abyste správně zpracovali velké údaje a získali jste uzemněné řešení? Vědci a praxe se shodují na obecném pochopení fráze "hledání skrytých zákonů". Zde jsou tři pozice:
  • nezřejmé;
  • objektivita;
  • praktická užitečnost.
  • První pozice znamená, že obvyklé metody neurčují, co je třeba najít a jak to udělat. Klasické programování se zde nevztahuje. Požadovaná, ne-li umělá inteligence, pak alespoň programy pro inteligentní analýzu dat. Pojem "intelektuální" není problém, než úkol stanovit dostatečné množství počátečních údajů pro rozhodování a formulaci původních pracovních pravidel.
    Objektivita - druh záruky, že zvolená technologie, vyvinutá "inteligentní" metoda nebo řada "inteligentních" pravidel dává důvod domnívat se, že výsledky jsou správné nejen autorovi,ale i další odborníci.

    , Oracle do svých softwarových produktů přispívá k představě objektivity bezpečného stavu postrádající negativní zahraniční intervencí. Praktická užitečnost - nejdůležitější kritérium pro výsledek a algoritmus pro řešení problému dolování dat v konkrétní aplikaci.

    Dolování dat: kde kopat

    Business Intelligence (Business Intelligence - BI) je základem moderního, nejdražšího a nejoblíbenějšího softwaru. Firmy při hledání obchodních řešení, které našli způsob řešení problémů zpracování velkého množství dat a jejich softwarových produktů může poskytnout bezpečný a rychlý rozvoj firmy všech velikostí. Stejně jako v případě umělé inteligence v oblasti inteligentní analýzy dat by současná úspěchy neměla být příliš přeceňována. Všechno se dostane jen na nohy, ale také popírat skutečné výsledky, nemůže. Rozsah působnosti. Analyzují se algoritmy analýzy intelektuálních dat v ekonomice, v oblasti výroby informací o kurzech směnných kurzů v oblasti informací o klimatu. Existují inteligentní produkty, které chrání společnost před negativním dopadem propuštěných pracovníků (oblast psychologie a sociologie je silným tématem) od virových útoků. Mnoho vývoje skutečně plní funkce, které deklarují jejich výrobci. Ve skutečnosti úkol - co dělat a kde to udělat - získal smysluplný a objektivní kontext:
  • minimální možný rozsah;
  • nejpřesnější a nejpřesnější účel;
  • zdroje dat a datajsou přeneseny na jeden základ.
  • Pouze rozsah a očekávaná praktická užitečnost mohou pomoci určit konkrétní technologii, metodiku, pravidla a základy dolování dat v konkrétním oboru.
    Informační technologie podaly žádost o vědeckou disciplínu a není nutné provádět malé kroky v novém, neprobudovaném směru. Klamání svatých svatých - přirozené inteligence, člověk nemůže od sebe sám požadovat, co se nedá dělat.
    Rozhodování, co dělat a kam jít, je dnes extrémně obtížné. V konkrétním oboru, v určité oblasti lidské činnosti, je možné nastínit množství informací, které mají být prozkoumány, a získat řešení, které bude charakterizováno určitým stupněm pravděpodobnosti a ukazatelem objektivity.

    Dolování dat: jak kopat

    Profesionální programování a vlastní vysoce kvalifikovaní pracovníci - jediný nástroj k dosažení požadovaného. Příklad 1. Úloha dolování dat nebude vyřešena čistou aplikací Oracle Load Testing Controller. Tento produkt je nárokován jako plnohodnotný a rozšiřitelný nástroj pro test zatížení. To je velmi úzký úkol. Nahrajte pouze! Nic víc, žádné vysoce intelektuální úkoly. Úkoly, na kterých je tento výrobek používán, však mohou utrpět neúspěch nejen pro zkušební osobu, ale i pro vývojáře, se všemi významnými předními osobami. Testování je zejména požadavek funkční úplnosti. Kde je záruka, že Oracle Load Testing Controller je "aktuální" na kterých datových sadáchmůže vstupovat do studovaného komplexu programu, serveru, softwaru a hardwaru.
    Příklad 2. Oracle Business Intelligence Suite Foundation Edition pro aplikace Oracle - Vývojář deklaruje tento produkt jako dobrou kombinaci s odbornými znalostmi v oblasti budování, rozvoje a poskytování velkého podnikání. Nepochybně je zkušenost společnosti Oracle skvělá, ale nestačí k jejímu přeměně prostřednictvím softwarového produktu. V konkrétním podniku v určité oblasti Business Intelligence společnosti Oracle nemusí fungovat na základě rozhodnutí daňové služby nebo rozhodnutí místní samosprávy.

    Inteligentní aplikace moderních technologií

    Jediným správným řešením v oblasti velkých objemů informací, dolování dat a systémů dolování dat společnosti, vládní agentury a ve všech socioekonomických oblastech - tým specialistů. Znalosti a zkušenosti kvalifikovaných odborníků jsou jediným správným řešením, které poskytne komplexní odpověď na otázky:
  • dolování dat: co kopat, kde to udělat a jak?
  • Kupitní prioritní produkty příslušného místa určení nebudou nadbytečné, ale předtím je třeba zvážit rozsah použití, formulovat předběžné rozhodnutí a dát předběžný účel. Pouze poté, co je oblast určena cílem a je poměrně jasná, můžete hledat řešení, která již byla vyvinuta a testována praxí. S největší pravděpodobností bude nalezen produkt, který objasní oblast a účel předmětu. Žádný program se dnes nedokáže vyrovnat se skutečným úkolem. Ztratil v oblasti umělé inteligencena počátku 80. let minulého století se chytrý člověk ještě nemůže spolehnout na to, že bude schopen napsat program, rozhodující intelektuální úkol.
    ​​Neměli bychom očekávat, že by AI přišla sama od sebe, ale ta, která byla zakoupena v Oracle, Microsoft a IBM, řekne, co je třeba udělat, a jaký výsledek je třeba považovat za správný. V moderním světě informačních technologií dochází k rychlému pokroku. Může mít účinnou roli, posílit vaše podnikání nebo vyřešit obtížný úkol. Ale musíte se účastnit, nezapočítáváte se na program. Programování je statická práce, její výsledek je rigidní algoritmus. Moderní intelektuální pravidlo nebo heuristika je pevně stanovené řešení, které nefunguje při první nejlepší šanci.

    Modelování a testování

    Inteligentní analýza velkých dat - skutečně relevantní a relevantní úkol. Ale oblast použití k odhalení tohoto problému je špatná, ale žila a rozvíjela se. Potřeba dalšího rozvoje podnikání představuje nové výzvy, které nám umožňují koncepčně vymezit rozsah rozsáhlého zpracování dat. Jedná se o přirozený proces vědeckého, technického a intelektuálního rozvoje podniku, společnosti, podnikání. To lze připsat internetovým technologiím, úkolům parsování informací na internetu. Existuje mnoho nových úkolů a programů, které jsou poptávané, mohou být více či méně jasně uspořádány a charakterizovány objektivním parametrem: jejich řešení je zajímavé a existuje pochopení pravděpodobného užitečnosti. Simulace -Dobře rozvinutá oblast, která je vybavena množstvím ověřených matematických metod. Model může být postaven vždy, bude čas a touha. Simulace umožňuje soustředit všechny dostupné znalosti do jednoho systému a cyklicky je vylepšit na soubor testovacích dat. Jedná se o klasickou vývojovou cestu, která byla také testována praxí. Pokud nebudete vytvářet vzduchové zámky a se stabilní a jistě jdete na stanovený cíl, pak můžete určit jak cestu, požadované řešení a konečný cíl.

    Programování a inteligentní metody

    Je programování na počátku 80. let minulého století vedla ke zrodu povědomí veřejnosti myšlenkami na umělou inteligenci, že se jednalo o předchůdce dolování dat, a že začal s dolování dat techniky. V těchto vzdálených časech neexistovaly problémy s velkými objemy dat. Dnes, nejen jako velké objemy dat, ale také jako výsledek vývoje databázových systémů řízení - významné zkušenosti v relačních vztazích, které jsou základem pro prezentaci dat.
    Relační vztahy jsou součástí, ale nejsou integrální. Stále existuje pojem systému, hierarchie a mnohem víc, než má přirozená inteligence, ale nedokáže umělou inteligenci realizovat: v tomto případě v programování. Programování není inteligence v žádném smyslu, ale je to skutečný výsledek aplikace inteligence v praxi. To je jeho obsah, a to je přesně to, co lze použít k dosažení požadovaných cílů.

    Aktivní znalosti a dovednosti

    Každý program je statický. Představuje konstrukci algoritmu řešení vv syntaxi programovacího jazyka. Moderní programovací jazyky jsou perfektním výsledkem 80. let a toto nelze popřít. Je třeba také poznamenat, že moderní programovací jazyky umožňují vytvářet volné algoritmy mimo syntaxi. Pokud někdo bude schopen napsat program, který nebude fungovat s vůlí svého autora, a vůli jejího získaných znalostí a dovedností, problém velkého množství dat a dělat inteligentní rozhodnutí se uzavře a začne nové kolo pro rozvoj znalostí.

    Související publikace