昨天解决了一个问题,书记将一个文件传给了办公室主任,此文件的扩展名为.zip,办公室主任解压后发现出现了一个文件夹,里面包含几个文件夹和一些xml文档,并没有公文。她找到我,我开始以为需要书记提供xml解析器来查看公文,后来经过仔细分析和查资料发现这个.zip仅仅是将Word2007产生的文件更改扩展名而成的。将.zip改回.docx,使用Office2007打开就可以查看和修改公文了。
经过这次事情,感觉Office2007的存储文件的格式与Office2003的存储文件格式存在不同,也就是.docx和.doc存在不同。
笔者进行了一次简单测试,分别将.docx和.doc两种文件的扩展名都修改成.zip的格式;并使用Winrar打开,之后发现.docx修改的可以打开,而.doc修改的提示错误“这个压缩文件格式未知或者数据已经被损坏”。
对将.docx修改扩展名成为压缩文件.zip文件进行解压,得到的同名目录下存在这以下几个目录和文件:目录_rels,目录docProps,目录word和文件[Content_Types].xml。
查资料基本与笔者经过实验测试得到的结果相同。
docx是Office2007使用的,是Microsoft OfficeWord2007文档的扩展名,它用新的基于XML的压缩文件格式取代了其目前专有的默认文件格式,在传统的文件名扩展名后面添加了字母x(即.docx取代.doc、.xlsx取代.xls,等等)
.docx格式的文件本质上是一个ZIP文件。将一个.docx文件的后缀改为ZIP后是可以用解压工具打开或是解压的。事实上,Word2007的基本文件就是ZIP格式的,他可以算作是.docx文件的容器。
.docx格式文件的主要内容是保存为XML格式的,但文件并非直接保存于磁盘。它是保存在一个ZIP文件中,然后取扩展名为.docx。将.docx格式的文件后缀改为ZIP后解压。可以看到解压出来的文件夹中有word这样一个文件夹,它包含了Word文档的大部分内容。而其中的document.xml文件则包含了文档的主要文本内容。
所以,遇到因为一些问题而形成的压缩文件,解压出来为如上文件夹和xml文档,不要着急,只要将扩展名改成.docx并且使用相应的软件打开就可以使用了。