IT|軟體|POI Apache Microsoft Office 格式檔案讀和寫功能

怎麼會命名成 Poor Obfuscation Implementation    15 November 2016 

POI 套件從 2001 年就開始了初始專案,由於 MS 的封閉特性,Office 檔案格式並沒有開放,作者就戲稱這個檔案格式是非常難以被理解,很混亂的一種檔案,就用了 Poor Obfuscation 這兩個字,當然還是成功地被 reverse-engineered,成就了這個專案,除了 MS Office 軟體之外,我們現在也可以用程式產生 Office 檔案。

主要元件    15 November 2016 

Excel (XSSF=HSSF+XSSF)
HSSF, XSSF
Excel 分為兩種檔案格式,比較舊的是 HSSFWorkbook,檔案格式為 Excel 1997-2003 版的Excel,副檔名是 xls,XSSFWorkbook 是 Excel 2007-10 的版本,副檔名是 xlsx。
基本的階層概念為一個 xlsx 檔案 XSSFWorkbook,裡面有多個工作表 XSSFSheet,每一個 Sheet 下面有一個表格,裡面有多列資料 XSSFRow,每列資料中有多欄資料儲存格 XSSFCell。

階層關係
XSSFWorkbook -> XSSFSheet -> XSSFRow -> XSSFCell

物件與檔案格式對應關係
Word (HWPF+XWPF)
PowerPoint (HSLF+XSLF)
OpenXML4J (OOXML)
OLE2 Filesystem (POIFS): OLE 2 Compound Document format 的Java Implementation
OLE2 Document Props (HPSF): Open Packaging Conventions (OPC) 的 Java Implementation
Outlook (HSMF)
Visio (HDGF+XDGF)
TNEF (HMEF): Microsoft's TNEF (Transport Neutral Encoding Format),也就是 winmail.dat,用在 Outlook 跟 Exchange -Publisher (HPBF): Publisher file format

參考

Java Code Examples



這封郵件來自 Evernote。Evernote 是您專屬的工作空間,免費下載 Evernote

留言

這個網誌中的熱門文章

IoT|硬體|樹莓派|外接麥克風及喇叭設置

成長|語文|學習-英文 持續更新!

IoT|硬體|通訊|Arduino 使用 SoftwareSerial Library 與電腦通訊