Почему утилита файлов идентифицирует файлы Microsoft Word как CDF? Что это за CDF?
У меня есть некоторые старые файлы Microsoft Word (возможно, Word 97), лежащие здесь, и заметили, что стандартная файловая утилита Unix идентифицирует такие файлы, как "CDF". На самом деле это более точно, демпинг подробных метаданных, например:
CDF V2 Document,
Little Endian,
Os: Windows,
Version 4.0,
Code page: 1252,
Title: ...,
Author: ...,
Template: Normal.dot,
Last Saved By: ...,
Revision Number: 1,
Name of Creating Application: Microsoft Word 8.0,
Create Time/Date: ...,
Last Saved Time/Date: ...,
Number of Pages: 1,
Number of Words: 95,
Number of Characters: 542,
Security: 0
Что означает CDF? Это общий формат контейнера, например RIFF для медиафайлов? Я не могу найти ничего полезного в Интернете. "Формат определения канала" и "Формат составного документа" явно не означают, поскольку эти файлы Microsoft Word полностью бинарны. Для Общий формат данных Я не могу найти соединение. Я попытался найти что-то в исходном коде файла util (в версии, которая поставляется с FreeBSD), но я мог только узнать, что у нее есть выделенный readcdf.c
, который имеет дело с этим форматом.
Ответы
Ответ 1
Формат составных документов связан с OLE/COM. Это относится к связыванию и вложению объектов, например диаграмм Excel в документах Word.
См. исторические (pre-XML) спецификации документа для MS Office, а конкретное описание формата файла - "Спецификация формата двоичного файла Windows Compound".