课题组有师兄刚刚答辩完,要求将600M以上的博士论文的docx版本改为要求:50M以内,doc版本后上传到系统中。

打开word一共有250页,图片密密麻麻,平均每一页的图片数量平均可达2张,而且大部分都是来自于origin的源文件,占据内存巨大,即便word内部对图片进行压缩,也仍然超出了600M。

于是本人通过一通搜索,找到了一个比较方便快捷的方法,能够在半小时以内,将内容压缩到50m以内,而且不需要一张张照片进行压缩分辨率。

闲话少叙,开始:

步骤1:根据自己的电脑版本下载对应版本的软件IrfanView - 官方主页 - 全球最受欢迎的观众之一

步骤2:按顺序安装该软件

步骤3:将目标docx通过重命名改名为文件名.zip,再解压缩到该位置,首先将word当中的embeddings文件夹删除,再打开word中的media,里面储存了docx中所有的图片,按照图片大小排序,将最占据内存的数张图片用IrfanView软件打开之后另存为png,然后将里面的原图片删除,而且将改变后的png后缀改为原图的后缀样式。比如:image4.emf(原图片,删除掉)->image4.png(另存为的图片,要改后缀)->imag4.emf。

步骤4:重复步骤3,大概十几次,就可以回到上一级包含有文件夹word,docProps,_relx,[Content_Types].xml再一起压缩为zip文件

步骤5:将该zip文件的zip后缀改为.docx,打开后该图片已经被替换为分辨率更低的图片了,docx占用的内存也下降了,同时另存为doc。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐