Jump to content

Ngjeshja e të dhënave

Nga Wikipedia, enciklopedia e lirë

Ngjeshja e të dhënave apo komprimimi (kompresimi) i të dhënave[1] është procesi i zvogëlimit të hapësirës së zënë nga të dhënat në një pajisje digjitale ose pajisje kompjuterike. Ky proces kryhet nëpërmjet algoritmeve të ndryshëm të kompresimit, duke ulur sasinë e bajtëve të nevojshëm për të përfaqësuar një të dhënë, qoftë kjo një imazh, një tekst, apo një skedar çfarëdo.

Ngjeshja e të dhënave ka për qëllim gjithashtu eliminimin e tepricave, duke u bazuar në faktin se shumë të dhëna përmbajnë informacion të tepërt që mund ose duhet të hiqet në një farë mënyre. Kjo mënyrë bazohet në një rregull, të quajtur kod ose protokoll, i cili, kur ndiqet, eliminon bitet e tepërta të informacionit, duke ulur kështu madhësinë e tyre në skedarë. Për shembull, vargu "AAAAAA," i cili zë 6 bajtë, mund të përfaqësohet me vargun "6A," që zë vetëm 2 bajtë, duke kursyer 67% të hapësirës.

Përveç eliminimit të tepricave, të dhënat ngjeshen për arsye të ndryshme. Ndër më të nevojshmet janë në kursimin e hapësirës në pajisjet e ruajtjes, si disqet e forta, ose përmirësimi i performancës gjatë transmetimeve (zvogëlimi i kohës së transmetimit).

Baza teorike e kompresimit mbështetet nga teoria e informacionit[2] dhe, më saktësisht, nga teorema e kodimit burimor e Shannon-it[3]. Teoritë e veçanta për fusha specifike përfshijnë teorinë e informacionit algoritmik për ngjeshjen pa humbje dhe teorinë e shkallës-shtrembërim për ngjeshjen me humbje. Këto fusha studimi u krijuan kryesisht nga Klod Shanon, i cili botoi punime themelore mbi këtë temë në fund të viteve 1940 dhe fillim të viteve 1950. Të tjera tema të lidhura me kompresimin përfshijnë teorinë e kodimit dhe përfundimeve statistikore.

Të mësuarit makinerik

[Redakto | Redakto nëpërmjet kodit]

Ekziston një lidhje e ngushtë midis të mësuarit makinerik dhe ngjeshjes. Një sistem që parashikon probabilitetet e pasëm të një vargu, duke u bazuar në të gjithë historinë e tij, mund të përdoret për ngjeshjen optimale të të dhënave (duke përdorur kodimin aritmetik mbi shpërndarjen e daljes). Anasjelltas, një ngjeshës optimal mund të përdoret për parashikim (duke gjetur simbolin që ngjesh më mirë, duke u bazuar në historinë e mëparshme). Kjo ekuivalencë është përdorur si një justifikim për përdorimin e kompresimit të të dhënave si një standard vlerësimi për "inteligjencën e përgjithshme."

Sipas teorisë AIXI[4], e shpjeguar në Çmimin Hutter[5], kompresimi më i mirë i mundshëm i x është softueri më i vogël i mundshëm që gjeneron x. Për shembull, në atë model, madhësia e skedarit të ngjeshur përfshin si skedarin zip ashtu edhe softuerin e shpaketimit (unzip), pasi nuk mund të shpaketohet pa të dyja, por megjithatë mund të ekzistojë një formë tjetër edhe më e vogël e këtij kombinimi.

Shembuj të softuerëve të ngjeshjes audio/video të fuqizuar nga Inteligjenca Artificiale janë: NVIDIA Maxine dhe AIVC. Shembuj të softuerëve që mund të kryejnë kompresim të imazheve të fuqizuar nga IA përfshijnë OpenCV, TensorFlow, MATLAB Image Processing Toolbox (IPT) dhe High-Fidelity Generative Image Compression.

të mësuarit e pambikëqyrur makinerik, grupimi me k-mesatare mund të përdoret për të kompresuar të dhënat duke grupuar pikët e dhënave të ngjashme në grupime. Kjo teknikë thjeshton trajtimin e grupeve të mëdha të të dhënave të paetiketuara paraprakisht dhe gjen përdorim të gjerë në fusha të tilla si kompresimi i imazheve.

  1. ^ Fjalor i Informatikës, Anglisht - Shqip, Shqip - Anglisht. Akademia e Shkencave dhe e Arteve e Kosovës.
  2. ^ "Data Compression Explained". mattmahoney.net (në anglisht). Marrë më 2024-11-24.
  3. ^ "Information theory: a tutorial introduction". Choice Reviews Online (në anglisht). 53 (09): 53–3973–53-3973. 2016-05-01. doi:10.5860/CHOICE.195473. ISSN 0009-4978.
  4. ^ "Marcus Hutter's AIXI model for Universal Artificial Intelligence". Pablo Padilla’s Blog (në anglisht). 2021-02-07. Marrë më 2024-11-24.
  5. ^ Hutter, Marcus. "Universal Artificial Intelligence". www.hutter1.net (në anglisht). Marrë më 2024-11-24.