20161116【充实计划】第282期 - 第8页

71楼

守候烟雨 发表于 2016-11-16 15:47:58

1.今天你阅读到的有价值的全文内容链接
http://finance.sina.com.cn/zl/nm ... xxsmif3127167.shtml

2.今天你阅读到的有价值的内容段落摘录
这个提前消费，不仅仅是进口产品，目前中国的通胀指数已经开始上升，国内很多商品的新一轮涨价潮或不可避免，只是幅度方面不太好预测。对于消费者来说，持续下降的利率降低了负债成本，原计划明年买的东西，今年可以先买；原计划明年出国旅游/深造/探亲的，今年先去；所有消费和出国计划可以适当提前。
中国很多投资者风险偏好较强（赌性较强），实际上也可以介入一些电子货币，类似比特币一类的资产，对冲人民币贬值是一方面，更主要的是可以期待一份“惊喜”，切记投入资金不要太大
从长远看，中国拥有强大的消费基础，这些消费带来的利润和价值最终会被更多的大企业所分享。你可以不会选股，看不懂周期，但一些吸纳了国内最优秀上市企业的指数从长远看一定是上涨的。买入指数基金其收益不会惊人，但其预期性收益要强过货币基金、债券等固定收益类市场，跑赢人民币贬值速度也是大概率事件。

3.今天你阅读到的有价值信息的自我思考点评感想
如果站在更长远的角度看，中国民众的财富总量和投资意识在逐步加强，所持有的资产应该扩展到全球市场。日本目前是全球最大的海外资产持有国，主要的原因就是当年日本放开了民众的海外投资限制，使得日本在国内经济停滞的二十多年里，海外财富的增长对冲了国内资产收益的下滑，日本民众的财富稳定性和安全性实际更高了，反过来给日本的传统制造业、医疗服务、科学研究等提供了非常好的基础和保障。这一点值得当前的中国学习。

4.昨日你阅读的时间量（小时计算，如0.5小时）
0.5小时

5.你参与活动至今的总时间量（小时计算，如20小时）
24小时

已有 1 人评分	论坛币	收起理由
充实每一天	+ 70	精彩帖子

总评分: 论坛币 + 70 查看全部评分

72楼

守候烟雨 发表于 2016-11-16 15:48:29

http://finance.sina.com.cn/zl/st ... xxsmic6348471.shtml
许家印的回马枪为了谁？

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

73楼

albert12345678 发表于 2016-11-16 15:51:28

科学网—知识分子理当合法合规地“富”起来
http://blog.sciencenet.cn/blog-829373-1015006.html

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

74楼

林暖露寒

发表于 2016-11-16 16:00:29 来自手机

昨日阅读1小时共计32.5小时

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

75楼

valleyforgemax

发表于 2016-11-16 16:13:17 来自手机

充实每一天发表于 2016-11-16 07:44
【加入充实计划】【了解充实计划】

|了解挑战30天|

昨日閱讀1小時
累計閱讀35小時

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

76楼

Annacristina 发表于 2016-11-16 17:08:05 来自手机

充实每一天发表于 2016-11-16 07:44
【加入充实计划】【了解充实计划】

|了解挑战30天|

2016年11月16日，昨日阅读1小时，总阅读时间1小时。是刚刚了解到这个活动的，十分感兴趣

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

77楼

1143502257 发表于 2016-11-16 17:15:29 来自手机

昨日阅读1.5小时，累计阅读120小时

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

78楼

albert12345678 发表于 2016-11-16 17:42:33

当我们谈战略时，我们在谈些什么？
http://www.hbrchina.org/2016-07-21/4339.html

已有 1 人评分	论坛币	收起理由
充实每一天	+ 10	精彩帖子

总评分: 论坛币 + 10 查看全部评分

79楼

IT小渣渣 发表于 2016-11-16 17:57:36

[试着用思想来投资] 20161116【充实计划】第282期

时间：2016-11-16 参与挑战30天第5天

1.今天你阅读到的有价值的全文内容链接
爬虫学习一系列：urllib2抓取网页内容：http://www.cnblogs.com/BaiYiShaoNian/p/4582131.html
正则表达式 - 语法：http://www.runoob.com/regexp/regexp-syntax.html
常用正则表达式大全（转）：http://blog.csdn.net/onebigday/article/details/5429868

2.今天你阅读到的有价值的内容段落摘录
所谓网页抓取，就是把URL地址中指定的网络资源从网络中读取出来，保存到本地。我们平时在浏览器中通过网址浏览网页，只不过我们看到的是解析过的页面效果，而通过程序获取的则是程序源代码。我们通过使用Python中urllib2来获取网页的URL资源，最简单方法就是调用urlopen 方法。
正则表达式，又称为正则表示法、常规表示法。正则表达式使用单个字符串来描述、匹配一系列符号某个句法规则的字符串。通俗的说，正则表达式就是在程序中定义了字符串的某种规则，然后我们在网页源代码中找出符合这种规则的所有代码语句，不符合的就淘汰不要。
因为今天看的网页主要是教程，大部分的有价值的内容都与正则表达式和urllib2库用法有关，在这里就不一一摘录了，有兴趣的论友可以去看一下第一部分提供的链接。

3.今天你阅读到的有价值信息的自我思考点评感想
昨天突突发奇想，LZ创建了“试着用思想来投资－挑战30天”这个活动，坛友在主题帖下面跟帖－读书签到，因为LZ没有限制读书内容(比如像我这种，感觉天天都在不务正业哈哈)，翻阅坛友的跟帖过程中，不时会发现一些精彩回帖，大概每天有7，8份的样子。并且坛友所阅读的内容，一部分也会随着时事的变化而发生改变，比如前段时间的美国大选。由于坛友问阅读习惯不同，选择读书资源的途径也因人而异，因此我发现即便大家在某个时间段所阅读的内容相似，但资源十分丰富，所以我打算写一个简单的爬虫，将这个活动每天的精彩帖子整理收集起来，想想可以如何利用一下(现在简单的想法是对时间段内热门时事的精彩回帖整理到一起，重新编辑生成一遍针对这个热门时事的全面解读)。

1) 利用Urllib2库获取页面Html实体

# 传入页码，获取该页帖子的代码
def getPage(self, pageNum):
try:
# 构建URL
url = 'https://bbs.pinggu.org/thread-' + self.baseURL + '-' + str(pageNum) + '-1.html'
request = urllib2.Request(url)
response = urllib2.urlopen(request)
# 返回'gbk'格式编码内容
return response.read().decode('gbk')
# 无法连接，报错
except urllib2.URLError, e:
if hasattr(e, "reason"):
print u"连接经管之家失败,错误原因", e.reason
return None

复制代码

2) 解析页面获取帖子标题－目的：将获取到的标题作为生成txt文件的标题

# 获取帖子标题
def getTitle(self, page):
# 得到标题的正则表达式
pattern = re.compile('<title>(.*?)</title>', re.S)
result = re.search(pattern, page)
if result:
# 如果存在，则返回标题
return result.group(1).strip()
else:
return None

复制代码

3) 解析页面获取帖子每一层楼的内容－目的：将获取到的内容作为生成txt文件的内容

def getContent(self, page):
# 匹配所有楼层的内容
pattern = re.compile('<td class="t_f.*?id="postmessage_.*?>(.*?)</td>', re.S)
items = re.findall(pattern, page)
contents = []
for item in items:
# 将文本进行去除标签处理，同时在前后加入换行符
tool = Tool()
content = tool.replace(item)
contents.append((content).encode('utf-8'))
return contents

复制代码

还有一些通过解析页面获取帖子一共有多少页；筛选内容；创建，写入txt的操作就不一一列举啦
最终我们需要的是帖子的代号，就能获得精彩回答的txt文件。比如今天挑战30天主题帖的地址：

https://bbs.pinggu.org/thread-4943302-1-1.html

那么帖子的代号为：4943302

不足：在解析内容的时候有一些标签处理的还有有瑕疵，生成的txt文件内容布局还不够美观，有时候也会存储一些写的较长的，或者引用较多的打卡内容。不过还是可以用哒，最后附上爬去昨天281期帖子的txt文件。有时间还不不断完善哒！

4.昨日你阅读的时间量：2 小时
5.你参与活动至今的总时间量：9.5 小时