內容一模一樣的兩份文檔,為什麼會有格式的區別?同樣是Word,發給了對方,但對方打不開。原來,即使同樣是Word,有的結尾是doc,有的卻是docx,前者是二進制,後者是XML格式,在內部結構、功能支持及兼容性等方面都存在著顯著差異。
doc是Microsoft Word 97-2003版本所使用的默認文件格式,以二進制形式存儲,包括文本、圖像、格式設置等資訊。雖然具有較強的穩定性和兼容性,但是在編輯和保存時容易出現亂碼、格式丟失等問題,也不利於文件內容的檢索和修改。而docx作為2007版以後的默認文件格式,採用了基於XML的開放文件格式,實際上是一個壓縮文件,其中包含了多個文件和文件夾,以XML和ZIP格式存儲文本、圖像、樣式等資訊。相比doc的體積更小,訪問速度更快。
同理,Excel表格的xls和xlsx也是二進制形式和XML的開放文件區別,xls最大支持65,536行、256列,而xlsx格式的文件最大支持1048576行、16384列,支持更多的函數和公式,更多的條件格式、數據驗證、圖標類型等,且採用了新加密算法,相比xls更加安全,格式的體積也較xls更小。
再分享一個Word文檔如何一鍵提取圖片的方法,當把docx格式改成rar後,它會自動變成一個「壓縮文件」,點擊提取壓縮包後,找到「media」文件夾,即可獲得Word文檔內所有的圖片和音頻素材,還不會影響圖片的質感,更能加快提取速度。如果不追求圖片質量,那麼,可以直接將Word文檔另存為網頁格式,也能「一鍵」獲得所有圖片素材。