Реклама
файл один из фундаментальные части компьютерного опыта. Но что такое файл? Это значок на рабочем столе, запись в списке, которая открывает ваш бюджет в виде электронной таблицы, и имя, которое вы можете присвоить своей последней селфи. В конце концов, «файл» - это набор битов (нулей и единиц), расположенных по шаблону, который понимает какое-то приложение.
Разработчики могут хранить эти шаблоны в секрете, что может заставить пользователей хранить определенную программу несмотря на альтернативы Полное руководство по конвертеру файлов Microsoft OfficeЕсли вы когда-либо конвертировали текстовый файл, например PDF в Word, вы знакомы с проблемой. Иногда это так же просто, как печатать, иногда нужны специальные инструменты. Введите этот конвертер руководство. Прочитайте больше . Другие разработчики могут поощрять принятие их форматов. В некоторых случаях вы можете легко открывать и интерпретировать формат, или может оказаться невозможным использование вне его собственного приложения. Мы рассмотрим примеры всего вышеперечисленного в этой статье.
Текстовые против Двоичные форматы файлов
Первый важный аспект различных типов файлов - будь то двоичный или текстовый. Давайте посмотрим на каждый из них по очереди.
Текстовые форматы
Текстовый файл - это самый основной формат файла. Это может быть прочитано практически любой системой с процессором. Этот формат представляет собой последовательность битов (единиц и нулей), которая соответствует стандарту ASCII (мы пропустим Unicode на данный момент), то есть компьютер может интерпретировать каждый байт (8 бит) как символ из числа следующий:
- A-Z (включая верхний и нижний регистр
- 0-9
- Космический персонаж
- Выбор символов (например, пунктуация)
- Управляющие символы (например, «DEL»)
Поскольку данные хранятся в виде текста, вы можете просмотреть содержимое файла, открыв его в Текстовый редактор, даже простые, такие как Windows Notepad 2 минималистских текстовых редактора, о которых вы, вероятно, никогда не слышалиПомимо того, что они предпочтительно основаны на быстрой загрузке, некоторые приложения просто не требуют слишком много ресурсоемких функций. Минималистичные приложения крошечные и чистые, и пока они выполняют свою работу, вы ... Прочитайте больше (или эквиваленты для макинтош Лучшие текстовые редакторы HTML для вашего MacНужен новый текстовый редактор для вашего Mac? Мы смотрим лучшие бесплатные и платные текстовые редакторы HTML для macOS. Прочитайте больше , Linux Сравнение расширенных текстовых редакторов Linux: kate vs geditЛюбой пользователь Linux скажет вам, что хороший текстовый редактор является жизненно важным компонентом компьютерной системы, независимо от того, являетесь ли вы новым пользователем или опытным профессионалом. Используя текст терминала ... Прочитайте больше , IOS Написать приложение: красивый текстовый редактор iOS с поддержкой Markdown и десятками действийНаписание приложений для iPad и iPhone в изобилии. Нам повезло жить в то время, когда разработчики придумывают новые способы редактирования текста, используя уникальные функции в новых приложениях. Это... Прочитайте больше , и Android Сравнение текстовых редакторов для Android без отвлекающих факторов: что лучше?Получите реальную работу на вашем Android-устройстве с помощью одного из этих удивительных текстовых редакторов. Прочитайте больше ). Поскольку почти все вычислительные платформы поставляются с базовым текстовым редактором, вы можете поместить некоторую (текстовую) информацию в один из этих файлов и быть уверенным, что вы всегда сможете получить к ней доступ. Другим приложениям не нужно ничего знать, чтобы хотя бы правильно прочитать данные.
Однако все становится сложнее, когда вам нужно представить что-то вроде шрифта текста или автоматически заполненной даты на титульной странице. В этих случаях символы ASCII способствуют текстовый формат такие как уценка Что такое уценка? 4 причины, почему вы должны изучить это сейчасУстали от HTML и WYSIWYG редакторов? Тогда Markdown - это ответ для вас, кто бы вы ни были. Прочитайте больше или XML. Хотя это дает преимущества простого текста, такого как прозрачность, эти файлы часто требуют больше места для таких элементов, как теги. Рассмотрим следующий файл с одним предложением в виде простого текста, а затем в формате «Открытый ODT» (FODT) в формате открытого документа, в котором используется XML. На рисунке ниже показано, что текстовая версия имеет длину 53 байта, а версия ODT - 25 000 байт.
Двоичные форматы
В противоположность, двоичные форматы Что такое бинарный? [Технология объяснила]Учитывая, что двоичный файл является настолько фундаментальным для существования компьютеров, кажется странным, что мы никогда раньше не занимались этой темой - поэтому сегодня я подумал, что дам краткий обзор того, что двоичный файл ... Прочитайте больше это файлы, которые приложение будет создавать постепенно. Вы можете попытаться открыть эти файлы в текстовом редакторе, но он, вероятно, не знает, как их интерпретировать. Ниже показан результат попытки открыть файл Microsoft Excel с помощью текстового редактора.
Приложение должно обрабатывать данные в двоичном файле определенным образом. При открытии файла XLS приложение должно обрабатывать первые шестнадцать байтов файла как маркер «начала файла» (BOF). В этом маркере пятый элемент представляет собой один бит, указывающий, был ли файл последний раз редактировался на платформе Windows («fWin»). Он идет после четырех других элементов, каждый по два байта, что означает, что элемент «fWin» - это 65-й бит в файле Excel.
Как мы видели, если вы попытаетесь открыть его с помощью приложения, которое не обрабатывает 65-й бит как флаг «fWin», это приложение не откроет его правильно. Он может отображать много искаженных символов на экране (показано выше), изящно обрабатывать это с сообщением об ошибке (также показано выше, потому что Linux), или сбой. В любом случае он не будет знать, как правильно читать данные, и поэтому не будет отображать их правильно. Но запрограммированные приложения могут обрабатывать столько форматов файлов, сколько пожелают.
Открытый против Собственные форматы
Следующее соображение заключается в том, является ли формат файла открытым (то есть доступным для простого использования другими пользователями) или закрытым. Обратите внимание, что «проприетарное» не то же самое, что закрытое, по крайней мере, не во всех случаях. В то время как «текст против бинарные »дебаты выше были техническими,« открытые против проприетарный »больше связан с условиями лицензирования формата файла. Подробнее об этом в следующих разделах.
Открытые форматы
Открытые форматы - это те, где лицензия позволяет пользователям применять их для своих собственных приложений. В какой-то мере орган по стандартизации должен также следить за их текущей разработкой сообществом участников для разработки форматов быть по-настоящему «открытым» Открытые форматы также не требуют затрат на лицензирование и ограничений - они могут использоваться кем угодно и для любых целей. Возможно, самый известный открытый формат формат открытого документа (ODF) 9 редких форматов офисных файлов, которые вы должны знатьВы когда-нибудь встречали странные форматы файлов в своем офисном пакете? Мы кратко расскажем о редких, но полезных типах офисных файлов и о том, для чего вы можете их использовать. Прочитайте больше впервые выпущен в 2005 году ОАЗИС. Его цель состояла в том, чтобы предложить альтернативу замку, который Microsoft имел на рынке производительности.
С открытыми форматами вам никогда не нужно бояться, что ваша информация заблокирована внутри определенного файла. Рассмотрим следующее, которое показывает наш файл формата Flat ODT. Несмотря на то, что вокруг него много посторонней информации, вы можете увидеть реальные данные там, как день.
Еще одним преимуществом открытых форматов является их тщательная документация. Одно дело, чтобы файл был легко читаемым. Программист все равно (методом проб и ошибок) должен выяснить, что именно делает каждая его функция. Но в случае ODF, спецификация версии 1.2 дает программисту все, что им нужно знать для эффективной поддержки.
Собственные форматы
Наконец, проприетарные форматы защищены их разработчиками. Это может быть связано с тем, что они содержат коммерческую тайну, в целях (предполагаемой) безопасности или просто потому, что разработчик не хочет делиться своей работой. Независимо от причины, эти форматы являются собственностью в силу Лицензионные соглашения с конечным пользователем (EULAs) или другие условия, запрещающие пользователю пытаться реконструировать или иным образом «взломать» формат файла.
Когда-то просто «запрещено», Закон о защите авторских прав в цифровую эпоху Что такое Закон об авторских правах на цифровые носители? Прочитайте больше (DCMA) изменил вещи. Разработчики теперь имеют юридическую поддержку для тех, кто перепроектирует их работу. Вы должны подумать о будущем, прежде чем инвестировать в приложение, которое использует собственный формат. Вам нужно будет перенести эту информацию куда-нибудь в будущем? Если да, то насколько больно это будет? Будет ли компания где-то через год или пять? Вам следует подумать о том, стоят ли функции приложения, если это также означает, что они должны быть заблокированы для этого разработчика из-за собственных форматов.
Примеры форматов файлов
Если вы посмотрите на вышесказанное, пара комбинаций выскочит на вас. Это правда, что текстовые форматы файлов поддаются открытости. Точно так же, если целью формата является запатентованный формат, проще сохранить его таким, сделав его двоичным. Но это не всегда так.
Формат изображения GIMP XCF - это открытый формат, который также является двоичным. Проект включает в себя Подробное описание о том, как формат содержит графику, текст и слои, которые составляют файл GIMP, в виде необработанных битов и байтов (показано ниже). Разработчики могут использовать это для кодирования своей собственной реализации, чтобы внешние приложения, такие как ImageMagick Как легко обрезать и изменять размеры изображений в LinuxЕсли вы хотите немного подрезать и изменить размеры в Linux - возможно, чтобы помочь с проектом или сделать изображение проще для загрузки в ваши любимые социальные сети - тогда попробуйте эти ... Прочитайте больше Инструментарий может импортировать их.
И наоборот, новейший формат Microsoft Visio (VSDX) представляет собой формат на основе XML (и, следовательно, на основе текста). Это публикует подробную ссылку из состава этих файлов. Однако в справочном документе отмечается, что у Microsoft «есть патенты, которые могут охватывать вашу реализацию» поддержки .VSDX. В дополнение Библиотека Конгресса заявляет, что использование спецификации VSDX «не гарантирует бесплатную лицензию всех соответствующих патентов», если вы ее используете. Это еще один способ сказать, что вы можете бросить кости и включить эту поддержку. Но Microsoft может или не может хотеть, чтобы вы заплатили за нее позже, в зависимости от того, насколько тесно она конкурирует с Visio.
Если вы думаете, что это сложно, как насчет неплоского формата ODT. Это файл в формате ZIP (бинарный и открытый, если вы также не используете его шифрование) который содержит текст документа (content.xml(открытый текстовый формат) и графику (например, PNG, двоичный, но открытый).
Насколько важны форматы файлов?
Это сложный вопрос. С одной стороны, некоторые операционные системы, такие как iOS, вообще пытались оградить пользователей от работы с файлами. У вас есть приложение, которое создало файл, чтобы открыть его, кого волнует его структура или каково его расширение? Тем не менее, многие организации (особенно правительства) настаивают на том, чтобы общедоступные данные находились в открытом формате.
Если вы идеалист программного обеспечения (хотя в этом нет ничего плохого), то, оценивая новые приложения, убедитесь, что они находятся в открытом (предпочтительно) текстовом формате. Если вы просто хотите приступить к работе, то проприетарные форматы могут не быть проблемой для вас.
Как вы думаете? Требуете ли вы, чтобы ваша информация находилась в открытых текстовых форматах, которые вы можете конвертировать и проверять? Или какие форматы используются разработчиками, проприетарные или нет, вам достаточно? Дайте нам знать ниже в комментариях!
Кредиты изображений: Edilus / Shutterstock
В течение пятнадцати лет Аарон работал в области технологий как бизнес-аналитик и менеджер проектов, и почти столько же лет был лояльным пользователем Ubuntu (со времен Breezy Badger). Его интересы включают в себя открытый исходный код, приложения для малого бизнеса, интеграцию Linux и Android, а также вычисления в текстовом режиме.