Allt du behöver veta om filformat och deras egenskaper

Vi använder ordfilen utbytbart: musik, bild, kalkylblad, bildspel och så vidare. Men vad gör en fil en fil, hur som helst? Låt oss försöka förstå denna grundläggande del av databehandling.

Vi använder ordfilen utbytbart: musik, bild, kalkylblad, bildspel och så vidare.  Men vad gör en fil en fil, hur som helst?  Låt oss försöka förstå denna grundläggande del av databehandling.
Annons

Filen är en av de grundläggande delarna av datorupplevelsen. Men vad är en "fil" ändå? Det är en ikon på skrivbordet, en post i en lista som öppnar din budget som ett kalkylblad och ett namn du kan ge till din senaste selfie. I slutet av dagen är en "fil" en samling bitar (nollor och sådana) arrangerade i ett mönster som någon applikation förstår.

Utvecklare kan hålla dessa mönster hemliga vilket kan göra att användare behåller ett visst program trots alternativ. Den fullständiga handboken för Microsoft Office File Converter. Den fullständiga handboken för Microsoft Office File Converter. Om du någonsin har konverterat en textfil, till exempel PDF till Word, känner du till utmaningen. Ibland är det lika lätt som utskrift, andra gånger behöver du specialverktyg. Ange denna konverteringsguide. Läs mer . Andra utvecklare kan faktiskt uppmuntra antagandet av deras format. I vissa fall kan du enkelt öppna och tolka formatet, eller det kan vara omöjligt att använda utanför sin ursprungliga applikation. Vi kommer att undersöka exempel på allt ovan i den här artikeln.

Textbaserad vs Binär filformat

Den första viktiga aspekten av olika filtyper är om det är binärt eller textbaserat. Låt oss titta på var och en av dessa i tur och ordning.

Textbaserade format

Textfilen är det mest grundläggande filformatet runt. Den kan läsas av nästan alla system där ute med en processor. Detta format är en sekvens av bitar (en och nollor) som följer ASCII-standarden (vi kommer att förbise Unicode för tillfället), vilket innebär att en dator kan tolka varje bitgrupp (8 bitar) som ett tecken bland följande:

  • AZ (inklusive stora och små bokstäver
  • 0-9
  • Mellanslag
  • Ett urval av symboler (t.ex. skiljetecken)
  • Styr tecken (t.ex. "DEL")

filformat ascii-struktur

Eftersom data lagras som text kan du se innehållet i en fil genom att öppna den i en textredigerare, även enkla som Windows Anteckningar 2 Minimalistiska textredigerare du nog aldrig hört av [Windows] 2 Minimalistiska textredigerare har du troligt Aldrig hört av [Windows] Bortsett från att de helst är baserade på höga laddningstider, behöver vissa applikationer inte bara för många resursintensiva funktioner. Minimalistiska applikationer är små och rena, och så länge de får jobbet gjort så ... Läs mer (eller motsvarande för Mac De bästa Mac Text Editors att använda 2018 De bästa Mac Text Editors att använda 2018 Behöver du en ny text redaktör för din Mac? Här är de bästa gratis och betalda macOS-textredigerarna för vanlig text, kodning och allt däremellan. Läs mer, Linux Advanced Linux Textredigerare Jämfört: kate vs gedit Avancerade Linux Textredigerare Jämfört: kate vs gedit Alla Linux Användaren kommer att berätta att en bra textredigerare är en viktig del av ett datorsystem, oavsett om du är en ny användare eller en erfaren proffs. Medan du använder en terminaltext ... Läs mer, iOS Skriv App: En härlig iOS Textredigerare med Markdown Support och dussintals åtgärder Skriv App: En härlig IOS Textredigerare med Markdown Support och dussintals åtgärder Att skriva apps till iPad och iPhone är rikliga. Vi har turen att leva i en tid när utvecklare kommer på Nya sätt att redigera text med unika funktioner i ny appar. Detta ... Läs mer, och Android 7 Distraction-Free Text Editors för Android Jämfört: Vilket är bäst? 7 Distraktionsfria textredigerare för Android Jämfört: Vilket är bäst? Få lite verk på din Android-enhet med hjälp av en av dessa fantastiska textredigerare. Läs mer ). Eftersom nästan alla datorplattformar skickas med en grundläggande textredigerare kan du lägga in lite (text) information i en av dessa filer och vara säker på att du alltid kan få tillgång till den. Andra applikationer behöver inte veta något mer för att åtminstone läsa data korrekt.

Men saker blir mer komplicerade när du behöver representera något som textfonten eller ett automatiskt fyllt datum på omslagssidan. I dessa fall bidrar ASCII-tecken till ett textbaserat format som Markdown What Is Markdown? 4 skäl till att du borde lära dig nu Vad är Markdown? 4 Anledningar till varför du borde lära dig nu Trött på HTML och WYSIWYG redaktörer? Då är Markdown svaret för dig, oavsett vem du är. Läs mer eller XML. Medan detta ger fördelarna med vanlig text som transparens, kräver dessa filer ofta mer utrymme för element som taggar. Tänk på följande en sentences-fil i vanlig text, och sedan i formatet Open Document Format (FODT), som använder XML. Nedanstående bild visar att textversionen är 53 byte, medan ODT-versionen är 25 000 byte .

filformat gillar

Binära formater

Däremot binära format Vad är binärt? [Teknologi förklarad] Vad är binärt? [Teknologi förklarad] Med tanke på att binär är så absolut grundläggande för förekomsten av datorer, verkar det konstigt att vi aldrig har tagit upp ämnet tidigare - så idag trodde jag att jag skulle ge en kort översikt över vad binär ... Läs Mer är filer som en applikation kommer att konstruera den bit för bit. Du kan försöka öppna dessa filer med en textredigerare, men det kommer troligen inte att tolka dem. Nedan visas resultatet av att försöka öppna en Microsoft Excel-fil med en textredigerare.

filformat textredigerare xls

Applikationen behöver bearbeta data i en binär fil på ett visst sätt. När en XLS-fil öppnas måste en ansökan behandla de första sexton bitarna av filen som "början av filen" (BOF) -markören. Inom den markören är det femte objektet en enda bit som indikerar huruvida filen senast redigerades på Windows-plattformen ("fWin"). Det kommer efter fyra andra objekt, vardera två byte, vilket betyder att "fWin" -delen är 65: e bit i Excel-filen.

filformat xls bof
Bildkredit: Microsoft

Som vi såg, om du försöker öppna den med en applikation som inte hanterar 65: e biten som "fWin" -flaggan, öppnas den inte korrekt. Det kan visa massor av förvrängd tecken på skärmen (visas ovan), hantera det med ett felmeddelande (visas ovan, för Linux) eller krasch. Under alla omständigheter kommer det inte att veta hur man läser data korrekt, och det kommer inte att visa det korrekt. Men applikationer, som en gång programmerats, kan hantera så många filformat som önskat.

Öppna vs. Proprietary Formats

Nästa överväganden är om ett filformat är öppet (dvs tillgängligt för enkel användning av andra) eller proprietär. Observera att "proprietär" inte är detsamma som stängt, åtminstone inte i alla fall. Medan "text vs. binär" debatten ovan var teknisk, har "open vs. proprietary" mer att göra med licensvillkoren för ett filformat. Mer om detta i följande avsnitt.

Öppna format

Öppna format är de där licensen tillåter användare att anta dem för egna applikationer. En standardkropp av något slag bör också övervaka den pågående utvecklingen av en grupp bidragsgivare för att formaten ska vara verkligen "öppna". Öppna format är också gratis licensieringskostnader och begränsningar - de kan användas av någon, för något ändamål. Kanske är det mest kända öppna formatet Open Document Format (ODF) 9 Sällsynta Office File Formats Du måste veta 9 Sällsynta Office File Formats Du måste veta Har du någonsin stött på konstiga filformat i din kontorsyta? Vi ger dig en snabb primer på sällsynta, men ändå användbara Office-filtyper och vad du kan använda dem för. Läs mer, först släppt 2005 av OASIS. Dess syfte var att erbjuda ett alternativ till det lås som Microsoft hade på produktivitetsmarknaden.

Med öppna format behöver du aldrig rädsla för att din information är låst i en viss fil. Tänk på följande, vilket visar vår platta ODT-formatfil. Medan det finns mycket främmande information runt det, kan du se de faktiska data där, tydliga som dag.

filformat som odt-källa

En annan fördel med öppna format är deras noggranna dokumentation. Det är en sak för en fil att vara lättläsbar. En programmerare kommer fortfarande (genom försök och fel) att behöva lista ut exakt vad varje funktion gör. Men när det gäller ODF ger version 1.2-specifikationen en programmerare allt de behöver veta för att kunna genomföra stöd för det effektivt.

Egenformat

Slutligen skyddas proprietära format av deras utvecklare. Det kan bero på att de innehåller affärshemligheter, i syfte att uppleva (uppfattad) säkerhet, eller helt enkelt för att utvecklaren inte vill dela sitt arbete. Oavsett anledningen är dessa format ägda i enlighet med slutanvändarlicensavtal (EULA) eller andra villkor som förbjuder användaren att försöka att omvända eller på annat sätt "spricka" filformatet.

En gång bara "förbjudet", Digital Millenium Copyright Act Vad är Digital Media Copyright Act? Vad är lagen om digital mediaupphov? Läs mer (DCMA) har ändrat saker. Utvecklare har nu den rättsliga backingen att gå efter de som omvändar deras arbete. Du bör tänka på framtiden innan du investerar i en applikation som använder ett proprietärt format. Behöver du migrera den informationen till någon annanstans i framtiden? Om så är fallet, hur smärtsamt kommer det att vara? Kommer företaget att vara runt om ett år, eller fem? Du bör överväga huruvida en apps funktioner är värda det om det också innebär att vara låst till den utvecklaren på grund av proprietära format.

Exempel på filformat

Om du tittar på ovanstående kommer ett par kombinationer att hoppa ut på dig. Det är sant att textbaserade filformat lånar sig vara öppna . På samma sätt, om målet för ett format är att vara proprietär, är det lättare att behålla det på det sättet genom att göra det binärt. Men det här är inte alltid fallet.

GIMP: s XCF-bildformat är ett öppet format som också är binärt. Projektet innehåller en detaljerad beskrivning av hur formatet innehåller grafiken, texten och lagren som utgör en GIMP-fil som råbitar och byte (visas nedan). Utvecklare kan använda detta för att koda sitt eget genomförande så externa applikationer som ImageMagick Så enkelt skörda och ändra storlek på bilder i Linux Så enkelt skörda och ändra storlek på bilder i Linux Om du vill göra några grundläggande beskärningar och resizing på Linux - kanske för att hjälpa till med ett projekt eller göra en bild lättare att ladda upp till dina favorit sociala nätverk - försök sedan dessa ... Läs mer verktygslåda kan importera dem.

filformat xcf struktur

Omvänt är det nyaste Microsoft Visio-formatet (VSDX) ett XML-baserat (och därmed textbaserat) format. Den publicerar en detaljerad referens om sminken av dessa filer. Referensdokumentet noterar dock att Microsoft "har patent som kan täcka ditt genomförande" av .VSDX-support. Dessutom använder kongressbiblioteket användningen av VSDX-specifikationen "garanterar inte royaltyfri licens för alla relevanta patent" om du använder den. Detta är ett annat sätt att säga att du kan rulla tärningarna och inkludera detta stöd. Men Microsoft kanske eller kanske inte vill att du ska betala för det senare, beroende på hur nära det konkurrerar med Visio.

Om du tror att de är komplicerade, hur är det med det icke-platta ODT-formatet. Det är en ZIP-formatfil (binär och öppen, såvida du inte använder dess kryptering) som innehåller ett dokuments text ( content.xml, öppet textbaserat format) och grafik (t.ex. PNG, binärt men öppet).

filformat som odt komprimera

Hur viktigt är filformat, egentligen?

Det här är en svår fråga. Å ena sidan har vissa operativsystem som iOS försökt isolera användare från att hantera filer alls. Du har appen som skapade filen för att öppna den, vem bryr sig om sin struktur eller vad den är tillägget? Ändå har många organisationer (särskilt regeringar) tryckt för att se till att offentliga data finns i ett öppet format.

Om du är en idealist för mjukvaran (inte att det är något fel på det), så måste du, när du utvärderar nya appar, se till att de finns i ett öppet (helst) textbaserat format. Om du bara vill komma till jobbet kanske inte proprietära format är ett problem för dig.

Vad tror du? Behöver du att din information finns i öppna, textbaserade format som du kan konvertera och verifiera? Eller är det okej format som utvecklarna använder, proprietär eller inte, tillräckligt för dig? Låt oss veta nedan i kommentarerna!

Bildkrediter: Edilus / Shutterstock

In this article