楼主: 充实每一天
9195 106

20161116【充实计划】第282期   [推广有奖]

71
守候烟雨 发表于 2016-11-16 15:47:58
1.今天你阅读到的有价值的全文内容链接
http://finance.sina.com.cn/zl/nm ... xxsmif3127167.shtml

2.今天你阅读到的有价值的内容段落摘录
这个提前消费,不仅仅是进口产品,目前中国的通胀指数已经开始上升,国内很多商品的新一轮涨价潮或不可避免,只是幅度方面不太好预测。对于消费者来说,持续下降的利率降低了负债成本,原计划明年买的东西,今年可以先买;原计划明年出国旅游/深造/探亲的,今年先去;所有消费和出国计划可以适当提前。
中国很多投资者风险偏好较强(赌性较强),实际上也可以介入一些电子货币,类似比特币一类的资产,对冲人民币贬值是一方面,更主要的是可以期待一份“惊喜”,切记投入资金不要太大
从长远看,中国拥有强大的消费基础,这些消费带来的利润和价值最终会被更多的大企业所分享。你可以不会选股,看不懂周期,但一些吸纳了国内最优秀上市企业的指数从长远看一定是上涨的。买入指数基金其收益不会惊人,但其预期性收益要强过货币基金、债券等固定收益类市场,跑赢人民币贬值速度也是大概率事件。

3.今天你阅读到的有价值信息的自我思考点评感想
如果站在更长远的角度看,中国民众的财富总量和投资意识在逐步加强,所持有的资产应该扩展到全球市场。日本目前是全球最大的海外资产持有国,主要的原因就是当年日本放开了民众的海外投资限制,使得日本在国内经济停滞的二十多年里,海外财富的增长对冲了国内资产收益的下滑,日本民众的财富稳定性和安全性实际更高了,反过来给日本的传统制造业、医疗服务、科学研究等提供了非常好的基础和保障。这一点值得当前的中国学习。

4.昨日你阅读的时间量(小时计算,如0.5小时)
0.5小时

5.你参与活动至今的总时间量(小时计算,如20小时)
24小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 70 精彩帖子

总评分: 论坛币 + 70   查看全部评分

72
守候烟雨 发表于 2016-11-16 15:48:29
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

73
albert12345678 发表于 2016-11-16 15:51:28
科学网—知识分子理当合法合规地“富”起来
http://blog.sciencenet.cn/blog-829373-1015006.html
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

74
林暖露寒 学生认证  发表于 2016-11-16 16:00:29 来自手机
昨日阅读1小时 共计32.5小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

75
valleyforgemax 在职认证  发表于 2016-11-16 16:13:17 来自手机
充实每一天 发表于 2016-11-16 07:44
【加入充实计划】【了解充实计划】

|了解挑战30天|
昨日閱讀1小時
累計閱讀35小時
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

76
Annacristina 发表于 2016-11-16 17:08:05 来自手机
充实每一天 发表于 2016-11-16 07:44
【加入充实计划】【了解充实计划】

|了解挑战30天|
2016年11月16日,昨日阅读1小时,总阅读时间1小时。是刚刚了解到这个活动的,十分感兴趣
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

77
1143502257 发表于 2016-11-16 17:15:29 来自手机
昨日阅读1.5小时,累计阅读120小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

78
albert12345678 发表于 2016-11-16 17:42:33
当我们谈战略时,我们在谈些什么?
http://www.hbrchina.org/2016-07-21/4339.html
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

79
IT小渣渣 发表于 2016-11-16 17:57:36
[试着用思想来投资] 20161116【充实计划】第282期
时间:2016-11-16 参与挑战30天 第5天

1.今天你阅读到的有价值的全文内容链接
爬虫学习一系列:urllib2抓取网页内容:http://www.cnblogs.com/BaiYiShaoNian/p/4582131.html
正则表达式 - 语法:http://www.runoob.com/regexp/regexp-syntax.html
常用正则表达式大全 (转):http://blog.csdn.net/onebigday/article/details/5429868

2.今天你阅读到的有价值的内容段落摘录
所谓网页抓取,就是把URL地址中指定的网络资源从网络中读取出来,保存到本地。我们平时在浏览器中通过网址浏览网页,只不过我们看到的是解析过的页面效果,而通过程序获取的则是程序源代码。我们通过使用Python中urllib2来获取网页的URL资源,最简单方法就是调用urlopen 方法。
正则表达式,又称为正则表示法、常规表示法。正则表达式使用单个字符串来描述、匹配一系列符号某个句法规则的字符串。通俗的说,正则表达式就是在程序中定义了字符串的某种规则,然后我们在网页源代码中找出符合这种规则的所有代码语句,不符合的就淘汰不要。
因为今天看的网页主要是教程,大部分的有价值的内容都与正则表达式和urllib2库用法有关,在这里就不一一摘录了,有兴趣的论友可以去看一下第一部分提供的链接。

3.今天你阅读到的有价值信息的自我思考点评感想
昨天突突发奇想,LZ创建了“试着用思想来投资-挑战30天”这个活动,坛友在主题帖下面跟帖-读书签到,因为LZ没有限制读书内容(比如像我这种,感觉天天都在不务正业 哈哈),翻阅坛友的跟帖过程中,不时会发现一些精彩回帖,大概每天有7,8份的样子。并且坛友所阅读的内容,一部分也会随着时事的变化而发生改变,比如前段时间的美国大选。由于坛友问阅读习惯不同,选择读书资源的途径也因人而异,因此我发现即便大家在某个时间段所阅读的内容相似,但资源十分丰富,所以我打算写一个简单的爬虫,将这个活动每天的精彩帖子整理收集起来,想想可以如何利用一下(现在简单的想法是对时间段内热门时事的精彩回帖整理到一起,重新编辑生成一遍针对这个热门时事的全面解读)。

1) 利用Urllib2库获取页面Html实体
  1. # 传入页码,获取该页帖子的代码
  2.     def getPage(self, pageNum):
  3.         try:
  4.             # 构建URL
  5.             url = 'https://bbs.pinggu.org/thread-' + self.baseURL + '-' + str(pageNum) + '-1.html'
  6.             request = urllib2.Request(url)
  7.             response = urllib2.urlopen(request)
  8.             # 返回'gbk'格式编码内容
  9.             return response.read().decode('gbk')
  10.         # 无法连接,报错
  11.         except urllib2.URLError, e:
  12.             if hasattr(e, "reason"):
  13.                 print u"连接经管之家失败,错误原因", e.reason
  14.                 return None
复制代码

2) 解析页面获取帖子标题-目的:将获取到的标题作为生成txt文件的标题
  1.     # 获取帖子标题
  2.     def getTitle(self, page):
  3.         # 得到标题的正则表达式
  4.         pattern = re.compile('<title>(.*?)</title>', re.S)
  5.         result = re.search(pattern, page)
  6.         if result:
  7.             # 如果存在,则返回标题
  8.             return result.group(1).strip()
  9.         else:
  10.             return None
复制代码

3) 解析页面获取帖子每一层楼的内容-目的:将获取到的内容作为生成txt文件的内容
  1.     def getContent(self, page):
  2.         # 匹配所有楼层的内容
  3.         pattern = re.compile('<td class="t_f.*?id="postmessage_.*?>(.*?)</td>', re.S)
  4.         items = re.findall(pattern, page)
  5.         contents = []
  6.         for item in items:
  7.             # 将文本进行去除标签处理,同时在前后加入换行符
  8.             tool = Tool()
  9.             content = tool.replace(item)
  10.             contents.append((content).encode('utf-8'))
  11.         return contents
复制代码


还有一些通过解析页面获取帖子一共有多少页;筛选内容;创建,写入txt的操作就不一一列举啦
最终我们需要的是帖子的代号,就能获得精彩回答的txt文件。比如今天挑战30天主题帖的地址:
https://bbs.pinggu.org/thread-4943302-1-1.html
那么帖子的代号为:4943302

不足:在解析内容的时候有一些标签处理的还有有瑕疵,生成的txt文件内容布局还不够美观,有时候也会存储一些写的较长的,或者引用较多的打卡内容。不过还是可以用哒,最后附上爬去昨天281期帖子的txt文件。有时间还不不断完善哒!

4.昨日你阅读的时间量:2 小时
5.你参与活动至今的总时间量:9.5 小时

已有 1 人评分论坛币 收起 理由
充实每一天 + 90 精彩帖子

总评分: 论坛币 + 90   查看全部评分

80
jclpym 发表于 2016-11-16 18:01:16 来自手机
充实每一天 发表于 2016-11-16 07:44
【加入充实计划】【了解充实计划】

|了解挑战30天|
昨日2小时,累计4小时
已有 1 人评分论坛币 收起 理由
充实每一天 + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2025-12-27 06:57