楼主: hsjianghw
5150 4

[网帖精选] Python脚本历遍当前目录提取xls单元格重命名文件 [推广有奖]

  • 0关注
  • 6粉丝

硕士生

21%

还不是VIP/贵宾

-

威望
0
论坛币
4425 个
通用积分
0.0065
学术水平
11 点
热心指数
16 点
信用等级
7 点
经验
3930 点
帖子
42
精华
0
在线时间
253 小时
注册时间
2010-3-21
最后登录
2017-7-31

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在论坛里下了些光盘版的统计年鉴,由于里面的文件名都是用编号命名的,而且存在年份不同编号不同的可能,查看起来很不方便,所以有了这个想法。

# -*- coding: utf-8 -*-

import os,shutil,glob
from pyExcelerator import *

if __name__ == '__main__':
    flist = glob.glob("*.xls")
    # get and write the absolute path
    fpath = os.path.abspath('.')
    logfile = open('log.txt','w')
    logfile.write(fpath + '\n')
    logfile.close()
    for fname in flist:
        # pick name from the xls files and renaming operation
        data = parse_xls(fname)
        newfname = data[0][1][(0,0)].encode('utf8') + '.xls'
        shutil.move(fname, newfname)
        # export log
        addlog = open('log.txt','a')
        addlog.write(fname + '  ---->  ' + newfname + '\n')
        addlog.close()

实现路径:
提取年鉴xls文件的第一个工作簿的A1单元格,作为新的文件名。

脚本的基本说明:
1、由于是脚本而不是可执行文件,所以需要解释环境。目前版本是在Python2.7下完成的,除了基本宏包/模块之外还使用了pyExcelerator包。
2、脚本在linux下使用正常。MSWindows未测试,可能会存在一些问题,比如A1单元格有换行或者其它非法字符。(linux下这些都没有影响)
3、编写这个脚本的大部分时间都花在解决文字编码的问题上了,因为处理xls文件我也是第一次,原来处理文本文件都没有碰到如此“严重”的编码问题,可能是因为xls文件都在win下完成,而linux的编码与win不同的原因吧。
4、python代码是严格注意格式的(缩进)。

使用方法和功能:
1、将脚本拷贝到文本文件,后缀命名为“.py”。
2、将此py脚本文件放到需要修改文件名的目录下,用python运行该脚本。
3、脚本会历遍该目录,并以xls表格第一个工作簿的第一行第一列的内容,重命名该文件。
4、脚本会将建立log.txt文件,将当前的绝对路径以及更名前后的变化情况写入到log文本。
PS:加密的xls目前应该不适用。

在此基础上可以扩展但目前未做的功能:
1、输出实际的表格名(A1),以及指标行,到某个文件(xls、txt、cvs...)
2、加入搜索模块,输出含检索词所有文件名。
3、通过py2exe打包成二进制代码,MSWin下可以直接用。

PS1:
如果有同好有兴趣的话可以一起交流。

PS2:
写这个脚本的目的只是为了在没有网络或者是在检查数据的时候使用。收集数据还是用数据库快很多。
现在的CNKI和Bankinfo,都有很好的统计数据库。
Bankinfo(CIB)里的是文本文件,是与年鉴中的形式一样。Bankinfo比CNKI的数据更新快些。
CNKI如果购买了的话,既能在年鉴导航中直接下xls表,又能在数据分析中选取需要的数据直接输出需要的指标。












二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python 单元格 xls operation absolute 命名

沙发
voodoo 发表于 2013-4-28 15:24:45 |只看作者 |坛友微信交流群
这功能用Excel内置的VBA编程不照样轻松搞定吗?
巫毒上传,必属佳品!
坛友下载,三思后行!

使用道具

藤椅
hsjianghw 发表于 2013-5-27 23:48:19 |只看作者 |坛友微信交流群
voodoo 发表于 2013-4-28 15:24
这功能用Excel内置的VBA编程不照样轻松搞定吗?
呃...
1、我主要用Linux,条件所限,用Excel不是很方便,也没研究过Openoffice/Libreoffice有没有类似Excel的VBA功能。
2、Excel的VBA可以不打开程序和文件,提取xls的内容?真没仔细研究过VBA,确实不知道如何实现。
3、这次是学习过程中的一个练习,下次也许是定点提取或筛选数据,归整后交给r处理,然后交给gnuplot出图。
Python是胶水语言,与很多程序都有接口(太多了,经典的开源软件和少量商业软件),简单的读一下手册就能作基本的应用了。Python的网络功能也是很厉害的,直接抓取统计数据库中的特定数据,也可能可行,至少现在用Python抓取网页数据的应用太多了。
当然,单次任务并不适合这么做,如果是重复性的任务,就很有用了。另一方面,Python是脚本语言,如果熟练的话,随写、随用、随丢的方式,也不是不可以。

使用道具

板凳
xixi2333 发表于 2019-11-30 00:28:58 来自手机 |只看作者 |坛友微信交流群
没有模块名怎么处理

使用道具

报纸
ostrich 发表于 2019-12-3 08:57:04 |只看作者 |坛友微信交流群
活学活用,感谢分享!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 08:16