Jaká je síla abecedy

Abeceda v informatice je nazývána systémem znaků, pomocí kterých můžete předložit informační zprávu. Pro pochopení podstaty této definice uvádíme několik dalších teoretických skutečností:

  • Veškeré zprávy se skládají z abecedy. Tento článek je například zpráva. Pak se skládá z znaků n-abecedy.
  • Pod symbolem rozumíme nejméně významnou část abecedy. Také nedělitelné částice se nazývají atomy. Symboly v ruské abecedě jsou "a", "b", "in" a tak dále.
  • Teoreticky abeceda nutně nemusí být zakódována. Například, v tištěné knize, znaky v abecedě znamenají, což znamená, že nemají žádné kódování.
  • Ale v praxi máme následující: počítač nechápe, co jsou písmena. Proto pro přenos informační zprávy musí být nejprve kódován v jazyce, který je pro počítač srozumitelný. Chcete-li se dále pohybovat, musíte zadat další podmínky.

    Jaká je síla abecedy

    Pod mocí abecedy máme na mysli celkový počet znaků v něm. Chcete-li zjistit, jakou moc abecedu, stačí započítat počet znaků v ní. Rozumím. Pro ruskou abecedu je síla abecedy 33 nebo 32 znaků, pokud nepoužíváte "e". Předpokládejme, že všechny symboly v naší abecedě jsou stejně pravděpodobné. Tento předpoklad lze chápat jako: předpokládejme, že máme pytel s podepsanýmikostičky Počet kostek v něm je nekonečný a každý z nich je podepsán pouze jedním znakem. Pak s rovnoměrným rozdělením, bez ohledu na to, jak moc dostaneme kostky z tašky, počet kostek s různými symboly bude stejný, nebo se bude snažit, aby to bylo s růstem počtu kostek, které dostaneme z tašky.

    Odhad váhy informačních zpráv

    Téměř před sto lety americký inženýr Ralph Hartley odvodil vzorec, podle kterého můžete odhadnout množství informací ve zprávě. Jeho vzorec pracuje pro pravděpodobnostní události a vypadá takto: i = log 2 M Kde i - počet nedělitelných atomů informací (bitů) ve zprávě, "M" - síla abecedy. Pojďme dál. Pomocí matematických transformací lze určit, že síla abecedy lze vypočítat následovně:

    M = 2 i Tento vzorec obecně definuje vztah mezi počtem stejně pravděpodobných událostí "M" a množstvím informací "i".

    Vypočítáme sílu

    S největší pravděpodobností již znáte ze školní vědy o počítačových vědách, že v moderních výpočetních systémech postavených na architektuře von Neumanna se používá binární kódovací systém. Kóduje jak aplikace, tak data. Chcete-li reprezentovat text ve výpočetním systému, použijte jednotný kód osmi číslic. Jednotný kód se proto pokládá za obsahující pevnou sadu prvků - 0 a 1. Hodnoty v tomto kódu jsou specifikovány určitým pořadím těchto prvků. S osmibitovým kódem můžeme kódovat zprávy o 256 bitů podle vzorceHartley: M 8 = 2 8 = 256 bitů informací. Taková situace s kódovým kódem binárního kódu se historicky vytvořila. Ale teoreticky bychom mohli reprezentovat data jinými abecedami. Například v chetыrehznakovom abecedy, každá postava by hmotnost ne jeden, ale dva bity v vosmyznakovom - 3 bity a tak dále. Vypočítá se pomocí výše uvedeného binárního logaritmu (i = log 2 M).
    Vzhledem k tomu abecedy kapacitou 256 bitů k označení jednoho znaku je dána osm bitů, bylo rozhodnuto zavést další opatření informací - bytů. Jeden byte obsahuje jeden znak tabulky kódů ASCII a obsahuje osm bitů.

    Jak se měří údaje

    Vosmibit Island kódování textových zpráv používané v kódu ASCII tabulky, až základní znakové sady v Latinské a cyrilice malými písmeny a řadě verzí, čísel, interpunkčních znamének a dalších základních symbolů. Chcete-li měřit velké objemy dat, použijte speciální předpony na bajty slov a bity. Tyto konzoly jsou uvedeny v následující tabulce:
    Mnoho lidí, kteří studovali fyziku namítnout, že přiměřeně by bylo použít klasické konzole pro indikaci jednotek informací (jako kilo - a hrozně), ale to není zcela správné, protože tyto předpony naznačovat hodnoty násobení pro konkrétní stupeň desítky, kdy se v počítačové vědě všude používá binární systém měření.

    Správná jména jednotek měření dat

    Za účelem vyloučenínesprávností a nepříjemností schválila Mezinárodní komise pro elektrotechniku ​​v březnu 1999 nové jednotky pro jednotky používané k určení množství informací v elektronické výpočetní technice. Takové předpony jsou meby, kibi, gibi, tebi, eksby a pety. Dokud tyto jednotky ještě nedosáhnou, je pravděpodobné, že je zapotřebí, aby byl tento standard implementován a rozšířen. Jak provést přechod z klasických jednotek na nově schválené, můžete definovat v následující tabulce:

    Předpokládejme, že máme text obsahující znaky K. Pak pomocí abecedního přístupu můžete vypočítat množství informací V obsažených v něm. Bude se rovnat síle produktu abecedy na informační váhu jednoho znaku v něm. Pomocí vzorce Hartley víme, jak vypočítat množství informací pomocí binárního logaritmu. Za předpokladu, že počet znaků v abecedě je N a počet znaků v záznamu informací o zprávách je K, získáváme následující vzorec pro výpočet objemu zprávy: V = K? log 2 N Abecední přístup ukazuje, že objem informací bude záviset pouze na kapacitě abecedy a velikosti zpráv (tj. počtu znaků v něm), ale nebude souviset se sémantickým obsahem pro osobu.

    Příklady výpočtu síly

    ve výuce přírodovědných jsou často dané úkoly najít sílu abecedy, délka zprávy nebo informace o svazku. Zde je jedna z následujících úkolů:"Textový soubor zabírá 11 kB místa na disku a obsahuje 11264 znaků. Zjistěte sílu abecedy tohoto textového souboru." Jaké řešení bude možné vidět na následujícím obrázku.
    Abeceda o kapacitě 256 znaků tedy nese pouze 8 bitů informací, což se v počítačové vědě nazývá jeden byte. Byte popisuje 1 znak tabulky ASCII, která, pokud si myslíte, není moc.

    Jeden byte - je to hodně nebo ne?

    Moderní data warehouse vzorky Datové centrá Google a Facebook obsahují ne méně než desítky petabytů informací. Přesné množství dat však bude obtížné vypočítat i pro sebe, protože pak budete muset zastavit všechny procesy na serverech a blízké uživatele, abyste měli přístup k záznamům a úpravám jejich osobních údajů.
    Ale představit si takové nepředstavitelné množství dat, člověk musí jasně pochopit, že všechno se skládá z malých detailů. Je třeba pochopit, proč je síla abecedy rovna (256) a kolik bitů obsahuje 1 bajt informací (jak si vzpomínáte, 8).

    Související publikace