Почему утилита файлов идентифицирует файлы Microsoft Word как CDF? Что это за CDF?

У меня есть некоторые старые файлы Microsoft Word (возможно, Word 97), лежащие здесь, и заметили, что стандартная файловая утилита Unix идентифицирует такие файлы, как "CDF". На самом деле это более точно, демпинг подробных метаданных, например:

CDF V2 Document,
Little Endian, 
Os: Windows, 
Version 4.0, 
Code page: 1252, 
Title: ..., 
Author: ..., 
Template: Normal.dot, 
Last Saved By: ..., 
Revision Number: 1, 
Name of Creating Application: Microsoft Word 8.0, 
Create Time/Date: ..., 
Last Saved Time/Date: ..., 
Number of Pages: 1, 
Number of Words: 95, 
Number of Characters: 542, 
Security: 0

Что означает CDF? Это общий формат контейнера, например RIFF для медиафайлов? Я не могу найти ничего полезного в Интернете. "Формат определения канала" и "Формат составного документа" явно не означают, поскольку эти файлы Microsoft Word полностью бинарны. Для Общий формат данных Я не могу найти соединение. Я попытался найти что-то в исходном коде файла util (в версии, которая поставляется с FreeBSD), но я мог только узнать, что у нее есть выделенный readcdf.c, который имеет дело с этим форматом.

Ответы

Ответ 1

Формат составных документов связан с OLE/COM. Это относится к связыванию и вложению объектов, например диаграмм Excel в документах Word.

См. исторические (pre-XML) спецификации документа для MS Office, а конкретное описание формата файла - "Спецификация формата двоичного файла Windows Compound".