楼主: ReneeBK
1220 0

GitHub排名前20的Pandas, NumPy 和SciPy函数 [推广有奖]

  • 1关注
  • 62粉丝

VIP

学术权威

14%

还不是VIP/贵宾

-

TA的文库  其他...

R资源总汇

Panel Data Analysis

Experimental Design

威望
1
论坛币
49407 个
通用积分
51.8704
学术水平
370 点
热心指数
273 点
信用等级
335 点
经验
57815 点
帖子
4006
精华
21
在线时间
582 小时
注册时间
2005-5-8
最后登录
2023-11-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

GitHub排名前20的Pandas, NumPy 和SciPy函数

[color=rgb(0, 0, 0) !important]大数据文摘



摘要: 几个月前,我看到一篇博文根据Github上的实例,列出了一些最流行的python库中最常用的函数/模块。我已将这些结果做了可视化并写下每个库中排名前10的例子。我在下文中列举了一些,完整版本可以在IPython notebook文 ...



几个月前,我看到一篇博文根据Github上的实例,列出了一些最流行的python库中最常用的函数/模块。我已将这些结果做了可视化并写下每个库中排名前10的例子。

我在下文中列举了一些,完整版本可以在IPython notebook文件中获得(链接地址https://github.com/agalea91/most ... hon_functions.ipynb)。 Github上最流行的Pandas,Pandas.DataFrame, NumPy和SciPy函数。

我使用python的requests和BeautifulSoup从原始博文中抓取了统计数据,并用matplotlib和seaborn制作了条形图,图中各个函数是按照包含实例的特殊库的数量排列的。例如,我们可以看到,尽管pd.Timestamp在Github上的所有实例中占有很大比例,但在项目中的使用频率并不如其它函数。

Pandas



1)Dataframe: 创建一个dataframe对象


6) 合并:合并dataframe



NumPy


3)arange: 在两个限值之间创建一个均等间隔值的数组。
8) mean:得到一个列表/数组所有数值的平均值或者行或列的平均值。
SciPy


1)stats: 一个包含不同统计函数和分布的模块(连续和离散)。
5)linalg: 此外,这个模块包含线性代数函数,包括inverse (linalg.inv),determinant(linalg.det),,和matrix/vector norm (linalg.norm)以及eigenvaluetools,例如:linalg.eig。
6)interpolate: 一个包含样条曲线和其它插值工具的模块。


8)signal: 这个模块必须直接引用,它包含信号处理工具。

10)misc: 一个包含了“仅在此出现的实用函数”的模块。基于谷歌搜索结果,人们常用misc.imread 和 mics.imsave来打开和保存图片。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:GitHub pandas panda Numpy NUM notebook 链接地址 python 完整版 发布者

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 18:55