楼主: CDA网校
1540 6

[数据挖掘新闻] 宅家之际,储备自己——30个Python最佳实践和技巧,你值得拥有! [推广有奖]

管理员

已卖:189份资源

泰斗

4%

还不是VIP/贵宾

-

威望
3
论坛币
123742 个
通用积分
11669.0657
学术水平
278 点
热心指数
286 点
信用等级
253 点
经验
230647 点
帖子
7048
精华
19
在线时间
4400 小时
注册时间
2019-9-13
最后登录
2026-2-5

初级热心勋章

楼主
CDA网校 学生认证  发表于 2020-2-6 14:22:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币


作者 | 读芯术


来源 | ID:AI_Discovery


温馨提示:官方宣布自2020年1月一日起将不再支持Python2。这份指南里的大多数例子也只在Python3中适用。如果您还在使用Python2.7,赶快更新吧。如果您使用的是苹果电脑,可以使用Homebrew轻松升级。

您可以直接使用代码来查看Python版本,确保将来不会出现脚本和Python版本不兼容的情况发生。请看示例:

  1. ifnot  sys.version_info > (2, 7):
  2.    # berate your user for running a  10 year
  3.    # python version
  4. elifnot  sys.version_info >= (3, 5):
  5.    # Kindly tell your user (s)he  needs to upgrade
  6.    # because you're using 3.5  features
复制代码

3. 使用IPython


实际上,IPython是一个增强的shell。自动完成功能已足以令人惊叹,但它还有更多功能。我非常喜欢内置的魔术命令。以下是一些例子:·%cd -用于更改当前工作目录·编辑-打开编辑器,并执行您在关闭编辑器后键入的代码· %env — 展示当前环境变量· %pip install [pkgs] — 在交互环境下安装包· %time 和 %timeit — 计算Python代码的执行时间另一个有用的功能是引用前一个命令的输出。In和Out是实际的对象。您可以通过使用Out[3]来进行第三个命令的输出。下载Python命令安装Ipython:
  1. pip3install ipython
复制代码

列表推导可以替换丑陋的用于填充列表的for循环。列表推导的基本语法是:

[expression for item in list if conditional ]这是一个最基本的例子,使用数字序列填充列表:
  1. mylist = [i for i inrange(10)]
  2. print(mylist)
  3. # [0, 1,  2, 3, 4, 5, 6, 7, 8, 9]
复制代码

同时你还可以用这种表达进行数学运算:

  1. squares = [x**2for x inrange(10)]
  2. print(squares)
  3. # [0, 1,  4, 9, 16, 25, 36, 49, 64, 81]
复制代码

甚至额外创建一个新函数:

  1. defsome_function(a):
  2.     return (a +5) /2
  3. my_formula  = [some_function(i) for i inrange(10)]
  4. print(my_formula)
  5. # [2, 3,  3, 4, 4, 5, 5, 6, 6, 7]
复制代码

最终,你可以使用“if”来过滤列表。在这个例子中,只保留了能被2整除的值

  1. filtered  = [i for i inrange(20) if i%2==0]
  2. print(filtered)
  3. # [0, 2,  4, 6, 8, 10, 12, 14, 16, 18]
复制代码

5.检查对象的内存使用

使用 sys.getsizeof(),可以检查对象的记忆内存:
  1. import sys
  2. mylist =range(0, 10000)
  3. print(sys.getsizeof(mylist))
  4. # 48
复制代码

为什么这样一个巨大的列表仅占48字节内存?这是因为range函数返回的类只表现为一个列表。范围比使用实际的数字列表更节省内存。你可以自己使用列表推导创建同一范围内的实际数字列表:

  1. import sys
  2. myreallist  = [x for x inrange(0, 10000)]
  3. print(sys.getsizeof(myreallist))
  4. # 87632
复制代码

6. 返回多个值


Python中的函数可以返回多个变量,而无需字典、列表或类。它的工作原理如下:
  1. defget_user(id):
  2.     # fetch user from database
  3.     # ....
  4.     return name,  birthdate
  5. name,  birthdate = get_user(4)
复制代码

对于有限数量的返回值,这是可以的。但是任何超过3个值的内容都应该放到一个(data)类中。

从3.7版开始,Python提供了数据类。与常规类或其他替代方法(如返回多个值或字典)相比,有几个优点:· 一个数据类需要最少的代码· 可以比较数据类,因为已经实现了_eq__· 您以轻易打印一个数据类进行调试,因为也实现了_repr__· 数据类需要类型提示,减少了出错几率下面是一个数据类的例子

  1. from  dataclasses import dataclass
  2. @dataclass
  3. classCard:
  4.     rank: str
  5.     suit: str
  6. card = Card("Q", "hearts")
  7. print(card == card)
  8. # True
  9. print(card.rank)
  10. # 'Q'
  11. print(card)
  12. Card(rank='Q', suit='hearts'
复制代码

点击这里查看高阶指南 。

一个小技巧就可以省略数行代码。

  1. a =1
  2. b =2
  3. a, b = b, a
  4. print (a)
  5. # 2
  6. print (b)
  7. # 1
复制代码

9. 合并字典(Python3.5+)

自Python3.5 以来,合并字典更为简便
  1. dict1 = { 'a': 1, 'b': 2 }
  2. dict2 = { 'b': 3, 'c': 4 }
  3. merged = { **dict1, **dict2 }
  4. print  (merged)
  5. # {'a':  1, 'b': 3, 'c': 4}
复制代码

如果有重叠的值,来自第一个字典的值将被覆盖。

写这只是其中一种有趣的玩法:

  1. mystring  ="10  awesome python tricks"
  2. print(mystring.title())
  3. '10  Awesome Python Tricks'
复制代码

11. 切割字符串至列表


可以将字符串拆分为字符串列表。在下例中,根据空格切割
  1. mystring  ="The  quick brown fox"
  2. mylist =  mystring.split(' ')
  3. print(mylist)
  4. #  ['The', 'quick', 'brown', 'fox']
复制代码

12. 从字符串列表中创建一个字符串

与上一个技巧正好相反,在本例中,从字符串列表中创建一个字符串,并在单词间输入空格:
  1. mylist = ['The', 'quick', 'brown', 'fox']
  2. mystring  ="  ".join(mylist)
  3. print(mystring)
  4. # 'The  quick brown fox'
复制代码

viewrawlist_to_string.py hostedwith ❤ by GitHub

13. 表情

表情要么是欢喜,要么是讨厌,这依表情而定。更重要的是,这在分析社交媒体数据时尤其有用。首先,下载表情模块
  1. pip3install emoji
复制代码

  1. import emoji
  2. result =  emoji.emojize('Python is :thumbs_up:')
  3. print(result)
  4. #  'Python is 'br/># You  can also reverse this:br/>result =  emoji.demojize('Python is :thumbs_up:'
复制代码

viewrawemoji.py hosted with ❤ by GitHub

访问表情包页面查看更多描述和示例

14. 制作列表切片

列表切片的句法:

a[start:stop:step]

Start, stop 和 step 都是可选项. 如果未设置,默认值会是· Start值为0· End为字符串末尾· step值为1以下是一个例子:

  1. # We can  easily create a new list from
  2. # the  first two elements of a list:
  3. first_two  = [1, 2, 3, 4, 5][0:2]
  4. print(first_two)
  5. # [1, 2]
  6. # And if  we use a step value of 2,
  7. # we can  skip over every second number
  8. # like  this:
  9. steps = [1, 2, 3, 4, 5][0:5:2]
  10. print(steps)
  11. # [1, 3,  5]
  12. # This  works on strings too. In Python,
  13. # you  can treat a string like a list of
  14. #  letters:
  15. mystring  ="abcdefdn  nimt"[::2]
  16. print(mystring)
  17. # 'aced  it'
复制代码


viewrawlist_slicing.py hosted with ❤ by GitHub

15. 反转字符串和列表

使用上面的切片符号来反转字符串或列表。通过使用负的步进值-1,从而反转元素:

  1. revstring  ="abcdefg"[::-1]
  2. print(revstring)
  3. #  'gfedcba'
  4. revarray  = [1, 2, 3, 4, 5][::-1]
  5. print(revarray)
  6. # [5, 4,  3, 2, 1]
复制代码


viewrawreversing_stuff.py hosted with ❤ by GitHub



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
CDA网校 学生认证  发表于 2020-2-6 14:22:45

16. 展示小猫

首先,安装Pillow(Python图像库的一个分支):

  1. pip3install Pillow
复制代码


下载这张图片,并把它命名为kittens.jpg:

图源 TheDigitalArtist Pixabay可以使用以下代码来显示Python代码中的图像:或者直接使用IPython:

  1. fromPILimport Image
  2. im =  Image.open("kittens.jpg")
  3. im.show()
  4. print(im.format,  im.size, im.mode)
  5. # JPEG  (1920, 1357) RGB
复制代码


viewrawpillow.py hosted with ❤ by GitHub



除了显示图像,Pillow还可以分析、调整大小、过滤、增强、变形等等。有关它的所有特性,请参阅文档。

17. 使用map()

Python的一个内置函数是map()。map()的语法是: map(function, something_iterable)给定一个要执行的函数,和一些要运行的变量。它可以是任何可迭代的元素。在下面的例子中,我将使用一个列表。

  1. defupper(s):
  2.     return  s.upper()
  3. mylist =list(map(upper,  ['sentence', 'fragment']))
  4. print(mylist)
  5. #  ['SENTENCE', 'FRAGMENT']
  6. #  Convert a string representation of
  7. # a  number into a list of ints.
  8. list_of_ints  =list(map(int, "1234567")))
  9. print(list_of_ints)
  10. # [1, 2,  3, 4, 5, 6, 7]
复制代码


viewrawmap.py hostedwith ❤ by GitHub

看看自己的代码,看看是否可以在某处使用map()而不是循环!

18. 从列表和字符串中提取独特元素

通过使用set()函数创建一个集合,可以从一个列表或类似列表的对象中获得所有独特的元素:

  1. mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
  2. print (set(mylist))
  3. # {1, 2,  3, 4, 5, 6}
  4. # And  since a string can be treated like a
  5. # list  of letters, you can also get the
  6. # unique  letters from a string this way:
  7. print (set("aaabbbcccdddeeefff"))
  8. # {'a',  'b', 'c', 'd', 'e', 'f'}
复制代码


viewrawset.py hosted with ❤ by GitHub

19. 找到频率出现最高的值

查找列表或字符串中最常出现的值:

  1. test = [1, 2, 3, 4, 2, 2, 3, 1, 4, 4, 4]
  2. print(max(set(test), key=  test.count))
  3. # 4
复制代码


viewrawmost_frequent.py hostedwith ❤ by GitHub

你明白为什么会这样吗?在继续阅读之前,试着自己找出答案。还没尝试吗?我要告诉你答案了。

· max()将返回列表中的最大值。key参数接受单个参数函数来定制排序顺序,在本例中,它是test.count。该函数应用于iterable上的每个项目。

· 测试。count是一个内置的列表函数。它接受一个参数,并将计算该参数的出现次数。因此test.count(1)将返回2,而test.count(4)将返回4。

· set(test)返回test中所有的唯一值,因此{1,2,3,4}因此,我们在这一行代码中所做的就是获取test的所有唯一值,即{1,2,3,4}。接下来,max将应用list.count 函数,并返回最大值。

20. 创建一个进度条

创建自己的进度条,这很有趣。但是使用进度包更快:

  1. pip3install progress
复制代码


现在可以花费更少的时间创建进度条

  1. from  progress.bar import Bar
  2. bar = Bar('Processing', max=20)
  3. for i inrange(20):
  4. # Do some work
  5.     bar.next()
  6. bar.finish()
复制代码


viewrawprogress_bar.py hostedwith ❤ by GitHub

21. 在交互式窗口中使用_

可以用下划线运算符得到最后一个表达式的结果,例如,在IPython中,如下所示:

  1. In [1]:3 * 3
复制代码


这也适用于Pythonshell。此外,IPython shell允许使用Out[n]来获取[n]中的表达式的值。例如,Out[1]会给出数字9。

22. 快速创建一个web服务器

快速启动web服务器,提供当前目录的内容:

python3-m http.server

如果您想与同事共享一些内容,或者想测试一个简单的HTML站点,这是非常有用的。

23. 多行字符串

尽管可以在代码中使用三引号将多行字符串包括在内,但这并不理想。放在三引号之间的所有内容都将成为字符串,包括格式,如下所示。

我更喜欢第二种方法,该方法将多行连接在一起,使您可以很好地格式化代码。唯一的缺点是您需要显式添加换行符。

  1. s1 ="""Multi  line strings can be put
  2.         between triple quotes. It's not ideal
  3.         when formatting your code  though"""
  4. print (s1)
  5. # Multi  line strings can be put
  6. #         between triple quotes. It's not  ideal
  7. #         when formatting your code though
  8. s2 = ("You  can also concatenate multiple\n"+
  9.         "strings  this way, but you'll have to\n"
  10.         "explicitly  put in the newlines")
  11. print(s2)
  12. # You  can also concatenate multiple
  13. #  strings this way, but you'll have to
  14. #  explicitly put in the newlines
复制代码


viewrawmultiline_strings.py hosted with ❤ by GitHub

24.三元运算符,用于条件赋值

这是使代码兼具简洁性与可读性的另一种方法:[on_true] if [expression] else[on_false]例子:

  1. x = "Success!" if (y== 2) else "Failed!"
复制代码


25. 计算频率

使用集合库中的Counter来获取包含列表中所有唯一元素计数的字典:

  1. from  collections import Counter
  2. mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
  3. c =  Counter(mylist)
  4. print(c)
  5. #  Counter({1: 2, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})
  6. # And it  works on strings too:
  7. print(Counter("aaaaabbbbbccccc"))
  8. #  Counter({'a': 5, 'b': 5, 'c': 5})
复制代码


viewrawcounter.py hosted with ❤ by GitHub

26. 链接比较运算符

在Python中链接比较运算符,以创建更易读和简洁的代码:

  1. x =10
  2. #  Instead of:
  3. if x >5and x <15:
  4.     print("Yes")
  5. # yes
  6. # You  can also write:
  7. if5< x <15:
  8.     print("Yes")
  9. # Yes
复制代码


viewrawchaining_comparisons.py hosted with ❤ by GitHub

27. 添加一些颜色

使用Colorama,在终端添加点颜色.

  1. from  colorama import Fore, Back, Style
  2. print(Fore.RED+'some  red text')
  3. print(Back.GREEN+'and  with a green background')
  4. print(Style.DIM+'and in  dim text')
  5. print(Style.RESET_ALL)
  6. print('back to  normal now')
复制代码


viewrawcolorama.py hosted with ❤ by GitHub




藤椅
CDA网校 学生认证  发表于 2020-2-6 14:23:11

28. 添加日期

python-dateutil模块提供了对标准datetime模块的强大扩展。通过以下方式安装:

pip3 install python-dateutil

您可以使用此库做很多很棒的事情。我只会重点介绍对我来说特别有用的例子:如模糊分析日志文件中的日期等。

  1. from  dateutil.parser import parse
  2. logline ='INFO  2020-01-01T00:00:01 Happy new year, human.'
  3. timestamp  = parse(log_line, fuzzy=True)
  4. print(timestamp)
  5. #  2020-01-01 00:00:01
复制代码


viewrawdateutil.py hosted with ❤ by GitHub

只需记住:常规的Python日期时间功能不奏效时,python-dateutil就派上用场了!

29. 整数除法

在Python 2中,除法运算符(/)默认为整数除法,除非操作数之一是浮点数。因此,有以下操作:

  1. # Python 25 / 2 = 25 / 2.0 = 2.5
复制代码


在Python 3中,除法运算符默认为浮点除法,并且//运算符已成为整数除法。这样我们得到:

  1. Python 35 / 2 = 2.55 // 2 = 2
复制代码


30. 使用chardet进行字符集检测

使用chardet模块来检测文件的字符集。在分析大量随机文本时,这很有用。

安装方式:

pip install chardet

现在,有了一个名为chardetect的额外命令行工具,可以像这样使用:

chardetect somefile.txtsomefile.txt: ascii with confidence 1.0

以上就是2020年30条最佳的代码技巧。我希望您能像享受创建列表一样,享受这些内容。如果您有任何意见,请随时发表评论!


板凳
小瓶九阳丹 发表于 2020-2-8 10:42:59

报纸
coldpeak 在职认证  发表于 2020-2-8 17:47:20
非常感谢分享。

地板
yldysas 发表于 2020-2-11 18:59:37 来自手机
CDA网校 发表于 2020-2-6 14:22
作者 | 读芯术
来源 | ID:AI_Discovery
温馨提示:官方宣布自2020年1月一日起将不再支持Python2。这份 ...
感谢分享!

7
flyhkboy 发表于 2020-2-15 00:52:39
不错,谢谢分享,宅家学习!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-5 17:46