十年網(wǎng)站開發(fā)經(jīng)驗 + 多家企業(yè)客戶 + 靠譜的建站團隊
量身定制 + 運營維護+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
學生試卷中的題目有要提交截圖的,也有要提交文件的,為了方便學生考試,允許單獨交或者嵌入Word中提交,那么事后如何整理學生的答案?單獨提交的比較方便,直接掃描文件名匹配名字后放入指定文件夾即可。但是嵌入到Word中的圖片和文件怎么提取出來呢?
我們提供的服務(wù)有:成都網(wǎng)站制作、網(wǎng)站設(shè)計、外貿(mào)網(wǎng)站建設(shè)、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認證、宜春ssl等。為上千家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學管理、有技術(shù)的宜春網(wǎng)站制作公司
現(xiàn)有如下需求:提取出一個Word文檔中所有的圖片(png、jpg)和嵌入的文件(任意格式)放入到指定的文件夾。
解決
docx是一個壓縮包,解壓縮后圖片一般都放在文檔名.docx\word\media\目錄下:
而嵌入式文件一般都放在文檔名.docx\word\embeddings\目錄下:
經(jīng)過詢問度娘,發(fā)現(xiàn)提取圖片比較簡單,直接使用docx庫中的Document.part.rels{k:v.target_ref}找到文件的相對路徑,用Document.part.rels{k:v.target_part.blob}讀出文件內(nèi)容。簡單判斷一下路徑和文件后綴是不是我們需要的media下的png文件和embeddings下的bin文件,是的話寫入到新文件中即可:
提取圖片
安裝python-docx庫
pip install python-docx