Podstawową jednostką zapisu informacji na dysku są bajty. Zawartość jednego bajtu jest umownie przedstawiana jako ciąg ośmiu zer i jedynek. Informacje zapisywane na dysku składają się z kolejnych bajtów niezależnie od tego jaka jest zawartość danego pliku. Oznacza to, że dane są kodowane, a sposób kodowania zależy od przeznaczenia pliku i może być zróżnicowany. Kodowanie jest konieczne, gdyż ciągi bajtów muszą reprezentować teksty, liczby, rozkazy dla procesora, czyli wiele różnych informacji. Dla celów obliczeniowych używa się większych jednostek jak kilobajt (lkfi – 20 czyli 1024 bajty) oraz megabajt (1MB – 20 bajtów). W dużych systemach komputerowych używa się też jednostek większych, gigabajtów, gdyż pojemność współczesnych pamięci dyskowych stale rośnie. Informacje zapisywane w plikach można podzielić na kilka grup zależnie od ich przeznaczenia:
- teksty zawierające ciągi liter i innych znaków pisarskich,
- programy w postaci binarnej (rozkazy dla procesora),
- liczby różnego typu i o różnej dokładności,
- dane zapisywane przez programy użytkowe (aplikacje), które kodują informacje wg własnego systemu.
- W każdym z wymienionych przypadków taki sam ciąg kolejnych bajtów może symbolizować różne rzeczy. Informacje, które można zapisać w jednymbajcie obejmują 256 różnych wartości, którym można przypisać liczby z zakresu od 0 do 255. Liczby te mogą zależnie od okoliczności symbolizować każde z wymienionych wyżej typów danych.