请 [注册] 或 [登录]  | 返回主站

量化交易吧 /  数理科学 帖子:3364740 新帖:4

二:爬虫_爬取_股吧帖子文本信息

美联储发表于:7 月 31 日 22:00回复(1)

上一篇 主要如何爬取数据,也就是获取数据。

本篇将进行一个小的文本数据分析项目实战演练,简单但完整。

大致四个步骤:
数据源
数据清洗
数据分析
结果可视化

希望各位能够领略到文本数据分析的乐趣。

如果有问题,欢迎留言,或者联系我的邮箱。

附件为 词云可视化 需要的中文字体文件,需要放到notebook的同级目录。

一 数据源:爬虫股吧的网页数据

# * pip install jhbdatafrom jhbdata import *
# 输入 股吧 首页的网址seed_url= 'http://guba.eastmoney.com/list,601162.html?from=BaiduAladdin'df=creep_guba(seed_url)df

.dataframe tbody tr th:only-of-type {        vertical-align: middle;    }    .dataframe tbody tr th {        vertical-align: top;    }    .dataframe thead th {        text-align: right;    }


阅读评论标题作者最后更新链接
04202今天买了几手试试看,还能涨不抉择050207-31 19:48http://guba.eastmoney.com/news,601162,85949975...
11421619.06.26:路过M波段W07-31 18:01http://guba.eastmoney.com/news,601162,84469872...
24330天风证券07月31日资金揭秘资金解密07-31 17:09http://guba.eastmoney.com/news,601162,85952392...
35601天风证券获2019证券公司AA类券商评级股友HxAhJg07-31 16:32http://guba.eastmoney.com/news,601162,85951687...
43180绿油油的韭菜地。[加仓][减仓][加仓][减仓]玩弄股市32107-31 15:57http://guba.eastmoney.com/news,601162,85951099...
57224下午翻红……天涯孤客20131407-31 15:20http://guba.eastmoney.com/news,601162,85944224...
68811天风证券助力中国通号科创板成功上市股友HxAhJg07-31 14:51http://guba.eastmoney.com/news,601162,85949481...
74501今天不错了没跟着华林跌太多大马虎12307-31 14:48http://guba.eastmoney.com/news,601162,85949365...
83900超大砸完大单砸,大单砸完中单砸,砸个不停股友miEgnH07-31 14:30http://guba.eastmoney.com/news,601162,85948427...
93420每天出不完的货股友XgAWkL07-31 14:30http://guba.eastmoney.com/news,601162,85948405...
103560庄很会玩,几分玩一天股友XuPqCF07-31 14:22http://guba.eastmoney.com/news,601162,85948038...
113420预蕊和临力两块废柴诸九不如07-31 14:22http://guba.eastmoney.com/news,601162,85948034...
123310会死股友iQ2Xhl07-31 14:17http://guba.eastmoney.com/news,601162,85947800...
133340憨货……光脱有毛用,吃呀天涯孤客20131407-31 14:08http://guba.eastmoney.com/news,601162,85947481...
143530这票走势完蛋了 换长城证券吧左右上下12307-31 14:00http://guba.eastmoney.com/news,601162,85947151...
1545709.8卖的路过,想上10元,至少要到大盘下一波行情了qsqsikj07-31 13:20http://guba.eastmoney.com/news,601162,85945611...
168311今天应该是地产领跌,科技先行,稀土突变,多元金融券股市三天游07-31 10:56http://guba.eastmoney.com/news,601162,85941902...
1774119.33哪个傻逼挂的,不撤马上把你吃了……天涯孤客20131407-31 10:27http://guba.eastmoney.com/news,601162,85940592...
189128每天都有一个疑问,主力每天流出,流不完吗?股友miEgnH07-31 10:03http://guba.eastmoney.com/news,601162,85939463...
194530这个垃圾股还有人抄吗股友9WjE7Q07-31 09:56http://guba.eastmoney.com/news,601162,85939090...
204870今天券商黄金大涨,捏住了李俊85092307-31 09:55http://guba.eastmoney.com/news,601162,85939022...
214801300270。战神350507-31 09:53http://guba.eastmoney.com/news,601162,85911365...
223991跌进八块我好接点anlylcl07-31 09:45http://guba.eastmoney.com/news,601162,85938513...
234360券商股最近真的拖累了大盘,不过天风你更过分,还要扯艳阳九连板07-31 09:44http://guba.eastmoney.com/news,601162,85938391...
243640跌进八块anlylcl07-31 09:43http://guba.eastmoney.com/news,601162,85938293...
254060慢慢下跌路,何时到尽头股友XgAWkL07-31 09:33http://guba.eastmoney.com/news,601162,85937752...
263730服不服?雪浪山07-31 09:28http://guba.eastmoney.com/news,601162,85937556...
2737923从7.22当天的大阴线,阴包阳可以看出,天风证券要回归追涨灬杀跌07-30 22:45http://guba.eastmoney.com/news,601162,85907263...
2812150天风证券07月30日资金揭秘资金解密07-30 17:07http://guba.eastmoney.com/news,601162,85923484...
2922515有关系吗?申大饭07-30 16:50http://guba.eastmoney.com/news,601162,85814721...
.....................
504750就是跟板块和大盘拉上去点,还是下跌途中an010207-30 10:49http://guba.eastmoney.com/news,601162,85913480...
515220说实话,今天没有5各点以上的涨幅,依然改变不了下行如花出阁了07-30 10:46http://guba.eastmoney.com/news,601162,85913396...
52139722全仓亏了十三点无聊过客201507-30 10:41http://guba.eastmoney.com/news,601162,85865276...
534030拉一波基民SDA2XV07-30 10:40http://guba.eastmoney.com/news,601162,85912944...
544470天风现在彻底沦为垃圾了an010207-30 10:39http://guba.eastmoney.com/news,601162,85912921...
555672卖掉红塔买了你基民SDA2XV07-30 10:38http://guba.eastmoney.com/news,601162,85912760...
564390傻逼,板块上啦你跟张,回调浪费机会雾里看花32107-30 10:38http://guba.eastmoney.com/news,601162,85912851...
575791上礼拜五下午叫买的赚两毛多了。股友reJdK307-30 10:31http://guba.eastmoney.com/news,601162,85912453...
585210买入!!!今年翻倍!!起航顺也07-30 10:23http://guba.eastmoney.com/news,601162,85912009...
594900挂单那么多,成交那么少雾里看花32107-30 10:19http://guba.eastmoney.com/news,601162,85911837...
605010买入,!!!这是今年大底!起航顺也07-30 10:10http://guba.eastmoney.com/news,601162,85911470...
614030三流货色股友我耍吃肉肉07-30 10:07http://guba.eastmoney.com/news,601162,85911292...
627655心态不好,不要进股市,要明白只有5%的人赚钱,所以你玩弄股市32107-30 10:04http://guba.eastmoney.com/news,601162,85868388...
634620不到10块不卖,李俊85092307-30 10:03http://guba.eastmoney.com/news,601162,85911005...
644190待涨的时候就靠后了,跌的时候头名第一股友FiYADH07-30 09:58http://guba.eastmoney.com/news,601162,85910807...
655662买在了9.44,不过小仓位不担心知行合一91107-30 09:57http://guba.eastmoney.com/news,601162,85910758...
664470为何每天都老套路股友9Z3Inb07-30 09:57http://guba.eastmoney.com/news,601162,85910780...
673670跑吧,出货股友LosYHe770607-30 09:56http://guba.eastmoney.com/news,601162,85910681...
684040把跌的本事拿出来涨就牛逼了股友zW37pt07-30 09:48http://guba.eastmoney.com/news,601162,85910232...
694290今天又跑到后面去了,哈哈股友zW37pt07-30 09:35http://guba.eastmoney.com/news,601162,85909469...
704520不会补跌吧[为什么][为什么][为什么]小小小涵涵07-30 09:20http://guba.eastmoney.com/news,601162,85908955...
7131712资讯 天风证券:大股东质押5300万股股票,占公司总股本1.02财经评论07-30 09:04http://guba.eastmoney.com/news,cjpl,859037261....
726011评级上升还这德性?股友q*DbQ07-30 08:51http://guba.eastmoney.com/news,601162,85908515...
737650转发枫叶红红火火07-29 23:35http://guba.eastmoney.com/news,601162,85906731...
7413175还是阴跌的,下午就清楚了,天风还有5个阴跌冒险一线07-29 22:43http://guba.eastmoney.com/news,601162,85895477...
756960微涨龙二,大跌龙一,哈哈,天风证券李连阴股友zW37pt07-29 21:43http://guba.eastmoney.com/news,601162,85905771...
76177550万万不可错过这个机会!逆向投资刘冰07-29 18:01http://guba.eastmoney.com/news,cfhpl,859036954...
779364七块我来抄底太子锋07-29 17:20http://guba.eastmoney.com/news,601162,85903230...
7810300天风证券07月29日资金揭秘资金解密07-29 17:06http://guba.eastmoney.com/news,601162,85903024...
79834214公告 601162:天风证券关于股东部分股权质押的公告天风证券资讯07-29 16:37http://guba.eastmoney.com/news,601162,85902502...

80 rows × 6 columns

df['标题']
0                       今天买了几手试试看,还能涨不
1                          19.06.26:路过
2                       天风证券07月31日资金揭秘
3                 天风证券获2019证券公司AA类券商评级
4             绿油油的韭菜地。[加仓][减仓][加仓][减仓]
5                               下午翻红……
6                    天风证券助力中国通号科创板成功上市
7                        今天不错了没跟着华林跌太多
8                 超大砸完大单砸,大单砸完中单砸,砸个不停
9                              每天出不完的货
10                          庄很会玩,几分玩一天
11                           预蕊和临力两块废柴
12                                  会死
13                        憨货……光脱有毛用,吃呀
14                      这票走势完蛋了 换长城证券吧
15          9.8卖的路过,想上10元,至少要到大盘下一波行情了
16           今天应该是地产领跌,科技先行,稀土突变,多元金融券
17               9.33哪个傻逼挂的,不撤马上把你吃了……
18               每天都有一个疑问,主力每天流出,流不完吗?
19                          这个垃圾股还有人抄吗
20                        今天券商黄金大涨,捏住了
21                             300270。
22                            跌进八块我好接点
23           券商股最近真的拖累了大盘,不过天风你更过分,还要扯
24                                跌进八块
25                         慢慢下跌路,何时到尽头
26                                服不服?
27         从7.22当天的大阴线,阴包阳可以看出,天风证券要回归
28                      天风证券07月30日资金揭秘
29                               有关系吗?
                    ...               
50                 就是跟板块和大盘拉上去点,还是下跌途中
51           说实话,今天没有5各点以上的涨幅,依然改变不了下行
52                             全仓亏了十三点
53                                 拉一波
54                         天风现在彻底沦为垃圾了
55                             卖掉红塔买了你
56                   傻逼,板块上啦你跟张,回调浪费机会
57                     上礼拜五下午叫买的赚两毛多了。
58                         买入!!!今年翻倍!!
59                         挂单那么多,成交那么少
60                       买入,!!!这是今年大底!
61                                三流货色
62          心态不好,不要进股市,要明白只有5%的人赚钱,所以你
63                            不到10块不卖,
64                  待涨的时候就靠后了,跌的时候头名第一
65                    买在了9.44,不过小仓位不担心
66                            为何每天都老套路
67                               跑吧,出货
68                       把跌的本事拿出来涨就牛逼了
69                        今天又跑到后面去了,哈哈
70                不会补跌吧[为什么][为什么][为什么]
71    资讯 天风证券:大股东质押5300万股股票,占公司总股本1.02
72                           评级上升还这德性?
73                                  转发
74               还是阴跌的,下午就清楚了,天风还有5个阴跌
75                微涨龙二,大跌龙一,哈哈,天风证券李连阴
76                         万万不可错过这个机会!
77                              七块我来抄底
78                      天风证券07月29日资金揭秘
79         公告 601162:天风证券关于股东部分股权质押的公告
Name: 标题, Length: 80, dtype: object
#解决乱码df.to_excel('stock_ba_news.xlsx',encoding="utf_8_sig")df.to_csv('stock_ba_news.csv',encoding="utf_8_sig")print('ok')
ok

二: 进行数据清洗

line_list=[i for i in df['标题'] ]line_list #变成列表
['今天买了几手试试看,还能涨不',
 ' 19.06.26:路过',
 '天风证券07月31日资金揭秘',
 '天风证券获2019证券公司AA类券商评级',
 '绿油油的韭菜地。[加仓][减仓][加仓][减仓]',
 '下午翻红……',
 '天风证券助力中国通号科创板成功上市',
 '今天不错了没跟着华林跌太多',
 '超大砸完大单砸,大单砸完中单砸,砸个不停',
 '每天出不完的货',
 '庄很会玩,几分玩一天',
 '预蕊和临力两块废柴',
 '会死',
 '憨货……光脱有毛用,吃呀',
 '这票走势完蛋了 换长城证券吧',
 '9.8卖的路过,想上10元,至少要到大盘下一波行情了',
 '今天应该是地产领跌,科技先行,稀土突变,多元金融券',
 '9.33哪个傻逼挂的,不撤马上把你吃了……',
 '每天都有一个疑问,主力每天流出,流不完吗?',
 '这个垃圾股还有人抄吗',
 '今天券商黄金大涨,捏住了',
 '300270。',
 '跌进八块我好接点',
 '券商股最近真的拖累了大盘,不过天风你更过分,还要扯',
 '跌进八块',
 '慢慢下跌路,何时到尽头',
 '服不服?',
 '从7.22当天的大阴线,阴包阳可以看出,天风证券要回归',
 '天风证券07月30日资金揭秘',
 ' 有关系吗?',
 '华林的儿子,可以回神了',
 '10月解禁18亿',
 '天风,天天疯',
 '这骨头真难啃',
 '亏九个点',
 '天风证券被评AA级券商,真的名不符实:股价比不过同是',
 '想涨真是难,慢慢陪主力耗,无非就是浪费时间,不着急',
 '今天又是套一村人,恶心哪',
 '1毛2毛踢的乐此不疲,主力你赢了[大笑]',
 '你咋这么不争气呢?这是要碎步的节奏。',
 '加油,疯起来,我看好你',
 '中国通号上市成功,主承销商是谁啊[微笑]?央企科创第',
 '尼玛永远的跟屁虫,做不了老大',
 '天风的托单终于没了!',
 '唉!老毛病又犯了,无语的烂票',
 '放量啦![胜利][胜利][胜利]下午有机会涨停板[胜利][',
 '这Sb股是有啥没爆的雷吗',
 '股市将人性,贪婪,欲望,体现的淋漓尽致。',
 '我出了3.95成本的京东方来买的天风,不涨点儿就太对不',
 '放量了',
 '就是跟板块和大盘拉上去点,还是下跌途中',
 '说实话,今天没有5各点以上的涨幅,依然改变不了下行',
 '全仓亏了十三点',
 '拉一波',
 '天风现在彻底沦为垃圾了',
 '卖掉红塔买了你',
 '傻逼,板块上啦你跟张,回调浪费机会',
 '上礼拜五下午叫买的赚两毛多了。',
 '买入!!!今年翻倍!!',
 '挂单那么多,成交那么少',
 '买入,!!!这是今年大底!',
 '三流货色',
 '心态不好,不要进股市,要明白只有5%的人赚钱,所以你',
 '不到10块不卖,',
 '待涨的时候就靠后了,跌的时候头名第一',
 '买在了9.44,不过小仓位不担心',
 '为何每天都老套路',
 '跑吧,出货',
 '把跌的本事拿出来涨就牛逼了',
 '今天又跑到后面去了,哈哈',
 '不会补跌吧[为什么][为什么][为什么]',
 '资讯 天风证券:大股东质押5300万股股票,占公司总股本1.02',
 '评级上升还这德性?',
 '转发',
 '还是阴跌的,下午就清楚了,天风还有5个阴跌',
 '微涨龙二,大跌龙一,哈哈,天风证券李连阴',
 '万万不可错过这个机会!',
 '七块我来抄底',
 '天风证券07月29日资金揭秘',
 '公告 601162:天风证券关于股东部分股权质押的公告']
import re# 只保留中文、大小写字母和阿拉伯数字def clear(text):reg = "[^0-9A-Za-z\u4e00-\u9fa5]"
   #print(re.sub(reg, '', text))return re.sub(reg, '', text)
#去除 停用词:无用的高频词汇is_stopword=['就是','呀','啊','了','的']

三:数据分析:进行词频统计

#分词,进行 词频统计,保存为字典格式import jieba.analyseimport jieba.possegimport json# 词性标注,提取景点def cut_news(line_list):#global sum#global sumsstat={} #字典#global z#with open('tiqu2097.txt', 'r')as f:for line in line_list:#print(line)line=clear(line) # 只保留中文、大小写字母和阿拉伯数字#line = line.encode('utf-8')print(line)seg = jieba.posseg.cut(line.strip())  # jieba分词,分词与词性标注同时进行,生成一个列表# print("/".join(seg))for i in seg:if i.word not in is_stopword:print(i,'kkkkk')#continue#if i.flag == 'jd': #正向筛选   if i.word not in stat: stat[i.word] = 0 # 不在字典中,0#else:stat[i.word] += 1  # 在字典中,加1#z += 1#计数器#print(z)# print(i.word, i.flag)# sum += i.word# print(sum)return stat# 其中join可以将分词结果变为列表格式。
#处理数据,统计词频aa=cut_news(line_list)aa
Building prefix dict from the default dictionary ...
Loading model from cache /var/folders/_s/x755ckgn1w51s23rh0vq67km0000gn/T/jieba.cache
今天买了几手试试看,还能涨不
今天买了几手试试看还能涨不
Loading model cost 0.911 seconds.
Prefix dict has been built succesfully.
今天/t kkkkk
买/v kkkkk
几手/m kkkkk
试试看/v kkkkk
还/d kkkkk
能涨/v kkkkk
不/d kkkkk
 19.06.26:路过
190626路过
190626/m kkkkk
路过/v kkkkk
天风证券07月31日资金揭秘
天风证券07月31日资金揭秘
天风/n kkkkk
证券/n kkkkk
07/m kkkkk
月/m kkkkk
31/m kkkkk
日/m kkkkk
资金/n kkkkk
揭秘/v kkkkk
天风证券获2019证券公司AA类券商评级
天风证券获2019证券公司AA类券商评级
天风/n kkkkk
证券/n kkkkk
获/v kkkkk
2019/m kkkkk
证券公司/n kkkkk
AA/eng kkkkk
类/q kkkkk
券商/n kkkkk
评级/vn kkkkk
绿油油的韭菜地。[加仓][减仓][加仓][减仓]
绿油油的韭菜地加仓减仓加仓减仓
绿油油/n kkkkk
韭菜/n kkkkk
地/uv kkkkk
加仓/v kkkkk
减仓/v kkkkk
加仓/v kkkkk
减仓/v kkkkk
下午翻红……
下午翻红
下午/t kkkkk
翻红/v kkkkk
天风证券助力中国通号科创板成功上市
天风证券助力中国通号科创板成功上市
天风/n kkkkk
证券/n kkkkk
助力/n kkkkk
中国通/nt kkkkk
号/m kkkkk
科/n kkkkk
创板/n kkkkk
成功/a kkkkk
上市/ns kkkkk
今天不错了没跟着华林跌太多
今天不错了没跟着华林跌太多
今天/t kkkkk
不错/a kkkkk
没/v kkkkk
跟着/v kkkkk
华林/nz kkkkk
跌太/n kkkkk
多/m kkkkk
超大砸完大单砸,大单砸完中单砸,砸个不停
超大砸完大单砸大单砸完中单砸砸个不停
超大/v kkkkk
砸/v kkkkk
完大/a kkkkk
单/d kkkkk
砸/v kkkkk
大/a kkkkk
单/d kkkkk
砸/v kkkkk
完/v kkkkk
中/f kkkkk
单/d kkkkk
砸/v kkkkk
砸/v kkkkk
个/q kkkkk
不停/d kkkkk
每天出不完的货
每天出不完的货
每天/r kkkkk
出不完/v kkkkk
货/n kkkkk
庄很会玩,几分玩一天
庄很会玩几分玩一天
庄/nr kkkkk
很/d kkkkk
会/v kkkkk
玩/v kkkkk
几分/m kkkkk
玩/v kkkkk
一天/m kkkkk
预蕊和临力两块废柴
预蕊和临力两块废柴
预蕊/n kkkkk
和/c kkkkk
临力/n kkkkk
两块/m kkkkk
废柴/n kkkkk
会死
会死
会/v kkkkk
死/v kkkkk
憨货……光脱有毛用,吃呀
憨货光脱有毛用吃呀
憨/ng kkkkk
货光/n kkkkk
脱有/v kkkkk
毛用/n kkkkk
吃/v kkkkk
这票走势完蛋了 换长城证券吧
这票走势完蛋了换长城证券吧
这/r kkkkk
票/n kkkkk
走势/n kkkkk
完蛋/v kkkkk
了换/v kkkkk
长城/ns kkkkk
证券/n kkkkk
吧/y kkkkk
9.8卖的路过,想上10元,至少要到大盘下一波行情了
98卖的路过想上10元至少要到大盘下一波行情了
98/m kkkkk
卖/v kkkkk
路过/v kkkkk
想/v kkkkk
上/f kkkkk
10/m kkkkk
元/m kkkkk
至少/d kkkkk
要/v kkkkk
到/v kkkkk
大盘/n kkkkk
下一/t kkkkk
波/ns kkkkk
行情/n kkkkk
今天应该是地产领跌,科技先行,稀土突变,多元金融券
今天应该是地产领跌科技先行稀土突变多元金融券
今天/t kkkkk
应该/v kkkkk
是/v kkkkk
地产/n kkkkk
领跌/v kkkkk
科技/n kkkkk
先行/n kkkkk
稀土/n kkkkk
突变/v kkkkk
多元/m kkkkk
金融/n kkkkk
券/n kkkkk
9.33哪个傻逼挂的,不撤马上把你吃了……
933哪个傻逼挂的不撤马上把你吃了
933/m kkkkk
哪个/r kkkkk
傻/a kkkkk
逼挂/v kkkkk
不/d kkkkk
撤/v kkkkk
马上/d kkkkk
把/p kkkkk
你/r kkkkk
吃/v kkkkk
每天都有一个疑问,主力每天流出,流不完吗?
每天都有一个疑问主力每天流出流不完吗
每天/r kkkkk
都/d kkkkk
有/v kkkkk
一个/m kkkkk
疑问/v kkkkk
主力/n kkkkk
每天/r kkkkk
流出/v kkkkk
流/v kkkkk
不/d kkkkk
完/v kkkkk
吗/y kkkkk
这个垃圾股还有人抄吗
这个垃圾股还有人抄吗
这个/r kkkkk
垃圾股/n kkkkk
还有/v kkkkk
人/n kkkkk
抄/v kkkkk
吗/y kkkkk
今天券商黄金大涨,捏住了
今天券商黄金大涨捏住了
今天/t kkkkk
券商/n kkkkk
黄金/n kkkkk
大/a kkkkk
涨/v kkkkk
捏住/v kkkkk
300270。
300270
300270/m kkkkk
跌进八块我好接点
跌进八块我好接点
跌进/v kkkkk
八块/m kkkkk
我/r kkkkk
好/a kkkkk
接点/n kkkkk
券商股最近真的拖累了大盘,不过天风你更过分,还要扯
券商股最近真的拖累了大盘不过天风你更过分还要扯
券商/n kkkkk
股/q kkkkk
最近/f kkkkk
真的/d kkkkk
拖累/v kkkkk
大盘/n kkkkk
不过/c kkkkk
天风/n kkkkk
你/r kkkkk
更/d kkkkk
过分/n kkkkk
还要/c kkkkk
扯/v kkkkk
跌进八块
跌进八块
跌进/v kkkkk
八块/m kkkkk
慢慢下跌路,何时到尽头
慢慢下跌路何时到尽头
慢慢/d kkkkk
下跌/v kkkkk
路/n kkkkk
何时/c kkkkk
到/v kkkkk
尽头/d kkkkk
服不服?
服不服
服不服/v kkkkk
从7.22当天的大阴线,阴包阳可以看出,天风证券要回归
从722当天的大阴线阴包阳可以看出天风证券要回归
从/p kkkkk
722/m kkkkk
当天/t kkkkk
大/n kkkkk
阴线/n kkkkk
阴包/n kkkkk
阳/nr kkkkk
可以/c kkkkk
看出/v kkkkk
天风/n kkkkk
证券/n kkkkk
要/v kkkkk
回归/v kkkkk
天风证券07月30日资金揭秘
天风证券07月30日资金揭秘
天风/n kkkkk
证券/n kkkkk
07/m kkkkk
月/m kkkkk
30/m kkkkk
日/m kkkkk
资金/n kkkkk
揭秘/v kkkkk
 有关系吗?
有关系吗
有/v kkkkk
关系/n kkkkk
吗/y kkkkk
华林的儿子,可以回神了
华林的儿子可以回神了
华林/nz kkkkk
儿子/n kkkkk
可以/c kkkkk
回神/v kkkkk
10月解禁18亿
10月解禁18亿
10/m kkkkk
月/m kkkkk
解禁/v kkkkk
18/m kkkkk
亿/m kkkkk
天风,天天疯
天风天天疯
天风/n kkkkk
天天/t kkkkk
疯/v kkkkk
这骨头真难啃
这骨头真难啃
这/r kkkkk
骨头/n kkkkk
真难/d kkkkk
啃/v kkkkk
亏九个点
亏九个点
亏/v kkkkk
九个/m kkkkk
点/m kkkkk
天风证券被评AA级券商,真的名不符实:股价比不过同是
天风证券被评AA级券商真的名不符实股价比不过同是
天风/n kkkkk
证券/n kkkkk
被评/v kkkkk
AA/eng kkkkk
级/q kkkkk
券商/n kkkkk
真的/d kkkkk
名不符实/i kkkkk
股价/n kkkkk
比/p kkkkk
不过/c kkkkk
同/p kkkkk
是/v kkkkk
想涨真是难,慢慢陪主力耗,无非就是浪费时间,不着急
想涨真是难慢慢陪主力耗无非就是浪费时间不着急
想涨/v kkkkk
真是/d kkkkk
难/a kkkkk
慢慢/d kkkkk
陪/v kkkkk
主力/n kkkkk
耗/v kkkkk
无非/c kkkkk
浪费时间/n kkkkk
不/d kkkkk
着急/a kkkkk
今天又是套一村人,恶心哪
今天又是套一村人恶心哪
今天/t kkkkk
又/d kkkkk
是/v kkkkk
套/q kkkkk
一村/n kkkkk
人/n kkkkk
恶心/n kkkkk
哪/r kkkkk
1毛2毛踢的乐此不疲,主力你赢了[大笑]
1毛2毛踢的乐此不疲主力你赢了大笑
1/m kkkkk
毛/nr kkkkk
2/m kkkkk
毛/nr kkkkk
踢/v kkkkk
乐此不疲/i kkkkk
主力/n kkkkk
你/r kkkkk
赢/v kkkkk
大笑/v kkkkk
你咋这么不争气呢?这是要碎步的节奏。
你咋这么不争气呢这是要碎步的节奏
你/r kkkkk
咋/r kkkkk
这么/r kkkkk
不争气/n kkkkk
呢/y kkkkk
这/r kkkkk
是/v kkkkk
要/v kkkkk
碎步/n kkkkk
节奏/n kkkkk
加油,疯起来,我看好你
加油疯起来我看好你
加油/v kkkkk
疯起来/v kkkkk
我/r kkkkk
看好/v kkkkk
你/r kkkkk
中国通号上市成功,主承销商是谁啊[微笑]?央企科创第
中国通号上市成功主承销商是谁啊微笑央企科创第
中国通/nt kkkkk
号/m kkkkk
上市/ns kkkkk
成功/a kkkkk
主/b kkkkk
承销商/n kkkkk
是/v kkkkk
谁/r kkkkk
微笑/vn kkkkk
央企科创/j kkkkk
第/m kkkkk
尼玛永远的跟屁虫,做不了老大
尼玛永远的跟屁虫做不了老大
尼玛/nrt kkkkk
永远/d kkkkk
跟屁虫/n kkkkk
做不了/v kkkkk
老大/a kkkkk
天风的托单终于没了!
天风的托单终于没了
天风/n kkkkk
托单/n kkkkk
终于/d kkkkk
没/v kkkkk
唉!老毛病又犯了,无语的烂票
唉老毛病又犯了无语的烂票
唉/zg kkkkk
老毛病/n kkkkk
又/d kkkkk
犯/v kkkkk
无语/nz kkkkk
烂票/n kkkkk
放量啦![胜利][胜利][胜利]下午有机会涨停板[胜利][
放量啦胜利胜利胜利下午有机会涨停板胜利
放量/v kkkkk
啦/y kkkkk
胜利/vn kkkkk
胜利/vn kkkkk
胜利/vn kkkkk
下午/t kkkkk
有/v kkkkk
机会/n kkkkk
涨停板/n kkkkk
胜利/vn kkkkk
这Sb股是有啥没爆的雷吗
这Sb股是有啥没爆的雷吗
这/r kkkkk
Sb/eng kkkkk
股/q kkkkk
是/v kkkkk
有/v kkkkk
啥/r kkkkk
没爆/v kkkkk
雷/n kkkkk
吗/y kkkkk
股市将人性,贪婪,欲望,体现的淋漓尽致。
股市将人性贪婪欲望体现的淋漓尽致
股市/n kkkkk
将/d kkkkk
人性/n kkkkk
贪婪/a kkkkk
欲望/v kkkkk
体现/v kkkkk
淋漓尽致/i kkkkk
我出了3.95成本的京东方来买的天风,不涨点儿就太对不
我出了395成本的京东方来买的天风不涨点儿就太对不
我/r kkkkk
出/v kkkkk
395/m kkkkk
成本/n kkkkk
京东方/nz kkkkk
来买/v kkkkk
天风/n kkkkk
不涨/v kkkkk
点儿/n kkkkk
就/d kkkkk
太/d kkkkk
对/p kkkkk
不/v kkkkk
放量了
放量了
放量/v kkkkk
就是跟板块和大盘拉上去点,还是下跌途中
就是跟板块和大盘拉上去点还是下跌途中
跟/p kkkkk
板块/n kkkkk
和/c kkkkk
大盘/n kkkkk
拉上去/v kkkkk
点/m kkkkk
还是/c kkkkk
下跌/v kkkkk
途中/s kkkkk
说实话,今天没有5各点以上的涨幅,依然改变不了下行
说实话今天没有5各点以上的涨幅依然改变不了下行
说实话/l kkkkk
今天/t kkkkk
没有/v kkkkk
5/m kkkkk
各/r kkkkk
点/q kkkkk
以上/f kkkkk
涨幅/n kkkkk
依然/d kkkkk
改变/v kkkkk
不了/v kkkkk
下行/v kkkkk
全仓亏了十三点
全仓亏了十三点
全仓/n kkkkk
亏了/v kkkkk
十三点/m kkkkk
拉一波
拉一波
拉一波/nr kkkkk
天风现在彻底沦为垃圾了
天风现在彻底沦为垃圾了
天风/n kkkkk
现在/t kkkkk
彻底/ad kkkkk
沦为/v kkkkk
垃圾/n kkkkk
卖掉红塔买了你
卖掉红塔买了你
卖掉/v kkkkk
红塔/nr kkkkk
买/v kkkkk
你/r kkkkk
傻逼,板块上啦你跟张,回调浪费机会
傻逼板块上啦你跟张回调浪费机会
傻/a kkkkk
逼/v kkkkk
板块/n kkkkk
上/f kkkkk
啦/y kkkkk
你/r kkkkk
跟/p kkkkk
张/nr kkkkk
回调/v kkkkk
浪费/n kkkkk
机会/n kkkkk
上礼拜五下午叫买的赚两毛多了。
上礼拜五下午叫买的赚两毛多了
上/f kkkkk
礼拜五/t kkkkk
下午/t kkkkk
叫买/v kkkkk
赚/v kkkkk
两/m kkkkk
毛/nr kkkkk
多/m kkkkk
买入!!!今年翻倍!!
买入今年翻倍
买入/v kkkkk
今年/t kkkkk
翻倍/d kkkkk
挂单那么多,成交那么少
挂单那么多成交那么少
挂单/n kkkkk
那么/r kkkkk
多/m kkkkk
成交/v kkkkk
那么/r kkkkk
少/a kkkkk
买入,!!!这是今年大底!
买入这是今年大底
买入/v kkkkk
这/r kkkkk
是/v kkkkk
今年/t kkkkk
大底/d kkkkk
三流货色
三流货色
三流/n kkkkk
货色/n kkkkk
心态不好,不要进股市,要明白只有5%的人赚钱,所以你
心态不好不要进股市要明白只有5的人赚钱所以你
心态/n kkkkk
不好/d kkkkk
不要/df kkkkk
进/v kkkkk
股市/n kkkkk
要/v kkkkk
明白/nr kkkkk
只有/c kkkkk
5/m kkkkk
人/n kkkkk
赚钱/v kkkkk
所以/c kkkkk
你/r kkkkk
不到10块不卖,
不到10块不卖
不到/v kkkkk
10/m kkkkk
块/q kkkkk
不/d kkkkk
卖/v kkkkk
待涨的时候就靠后了,跌的时候头名第一
待涨的时候就靠后了跌的时候头名第一
待涨/v kkkkk
时候/n kkkkk
就/d kkkkk
靠/v kkkkk
后/f kkkkk
了跌/v kkkkk
时候/n kkkkk
头名/n kkkkk
第一/m kkkkk
买在了9.44,不过小仓位不担心
买在了944不过小仓位不担心
买在/v kkkkk
944/m kkkkk
不过/c kkkkk
小/a kkkkk
仓位/n kkkkk
不/d kkkkk
担心/v kkkkk
为何每天都老套路
为何每天都老套路
为何/r kkkkk
每天/r kkkkk
都/d kkkkk
老套路/n kkkkk
跑吧,出货
跑吧出货
跑/v kkkkk
吧/y kkkkk
出货/v kkkkk
把跌的本事拿出来涨就牛逼了
把跌的本事拿出来涨就牛逼了
把跌/v kkkkk
本事/r kkkkk
拿/v kkkkk
出来/v kkkkk
涨/v kkkkk
就/d kkkkk
牛/n kkkkk
逼/v kkkkk
今天又跑到后面去了,哈哈
今天又跑到后面去了哈哈
今天/t kkkkk
又/d kkkkk
跑/v kkkkk
到/v kkkkk
后面/f kkkkk
去/v kkkkk
哈哈/o kkkkk
不会补跌吧[为什么][为什么][为什么]
不会补跌吧为什么为什么为什么
不会/v kkkkk
补跌/v kkkkk
吧/y kkkkk
为什么/r kkkkk
为什么/r kkkkk
为什么/r kkkkk
资讯 天风证券:大股东质押5300万股股票,占公司总股本1.02
资讯天风证券大股东质押5300万股股票占公司总股本102
资讯/n kkkkk
天风/n kkkkk
证券/n kkkkk
大/a kkkkk
股东/n kkkkk
质押/v kkkkk
5300/m kkkkk
万股/m kkkkk
股票/n kkkkk
占/v kkkkk
公司/n kkkkk
总/b kkkkk
股本/n kkkkk
102/m kkkkk
评级上升还这德性?
评级上升还这德性
评级/vn kkkkk
上升/v kkkkk
还/d kkkkk
这/r kkkkk
德性/n kkkkk
转发
转发
转发/v kkkkk
还是阴跌的,下午就清楚了,天风还有5个阴跌
还是阴跌的下午就清楚了天风还有5个阴跌
还是/c kkkkk
阴跌/v kkkkk
下午/t kkkkk
就/d kkkkk
清楚/a kkkkk
天风/n kkkkk
还有/v kkkkk
5/m kkkkk
个/m kkkkk
阴跌/v kkkkk
微涨龙二,大跌龙一,哈哈,天风证券李连阴
微涨龙二大跌龙一哈哈天风证券李连阴
微涨/v kkkkk
龙二/nr kkkkk
大跌/v kkkkk
龙一/nr kkkkk
哈哈/o kkkkk
天风/n kkkkk
证券/n kkkkk
李连阴/nr kkkkk
万万不可错过这个机会!
万万不可错过这个机会
万万不可/i kkkkk
错过/v kkkkk
这个/r kkkkk
机会/n kkkkk
七块我来抄底
七块我来抄底
七块/m kkkkk
我/r kkkkk
来/v kkkkk
抄底/n kkkkk
天风证券07月29日资金揭秘
天风证券07月29日资金揭秘
天风/n kkkkk
证券/n kkkkk
07/m kkkkk
月/m kkkkk
29/m kkkkk
日/m kkkkk
资金/n kkkkk
揭秘/v kkkkk
公告 601162:天风证券关于股东部分股权质押的公告
公告601162天风证券关于股东部分股权质押的公告
公告/n kkkkk
601162/m kkkkk
天风/n kkkkk
证券/n kkkkk
关于/p kkkkk
股东/n kkkkk
部分/n kkkkk
股权/n kkkkk
质押/v kkkkk
公告/n kkkkk
{'07': 3,
 '1': 1,
 '10': 3,
 '102': 1,
 '18': 1,
 '190626': 1,
 '2': 1,
 '2019': 1,
 '29': 1,
 '30': 1,
 '300270': 1,
 '31': 1,
 '395': 1,
 '5': 3,
 '5300': 1,
 '601162': 1,
 '722': 1,
 '933': 1,
 '944': 1,
 '98': 1,
 'AA': 2,
 'Sb': 1,
 '一个': 1,
 '一天': 1,
 '一村': 1,
 '七块': 1,
 '万万不可': 1,
 '万股': 1,
 '三流': 1,
 '上': 3,
 '上升': 1,
 '上市': 2,
 '下一': 1,
 '下午': 4,
 '下行': 1,
 '下跌': 2,
 '不': 7,
 '不了': 1,
 '不争气': 1,
 '不会': 1,
 '不停': 1,
 '不到': 1,
 '不好': 1,
 '不涨': 1,
 '不要': 1,
 '不过': 3,
 '不错': 1,
 '两': 1,
 '两块': 1,
 '个': 2,
 '中': 1,
 '中国通': 2,
 '临力': 1,
 '为什么': 3,
 '为何': 1,
 '主': 1,
 '主力': 3,
 '乐此不疲': 1,
 '九个': 1,
 '买': 2,
 '买入': 2,
 '买在': 1,
 '了换': 1,
 '了跌': 1,
 '亏': 1,
 '亏了': 1,
 '京东方': 1,
 '人': 3,
 '人性': 1,
 '亿': 1,
 '今天': 7,
 '今年': 2,
 '从': 1,
 '仓位': 1,
 '以上': 1,
 '会': 2,
 '体现': 1,
 '何时': 1,
 '你': 8,
 '依然': 1,
 '做不了': 1,
 '傻': 2,
 '儿子': 1,
 '元': 1,
 '先行': 1,
 '全仓': 1,
 '八块': 2,
 '公司': 1,
 '公告': 2,
 '关于': 1,
 '关系': 1,
 '减仓': 2,
 '几分': 1,
 '几手': 1,
 '出': 1,
 '出不完': 1,
 '出来': 1,
 '出货': 1,
 '创板': 1,
 '到': 3,
 '券': 1,
 '券商': 4,
 '加仓': 2,
 '加油': 1,
 '助力': 1,
 '十三点': 1,
 '华林': 2,
 '单': 3,
 '卖': 2,
 '卖掉': 1,
 '占': 1,
 '去': 1,
 '又': 3,
 '只有': 1,
 '叫买': 1,
 '可以': 2,
 '号': 2,
 '吃': 2,
 '各': 1,
 '同': 1,
 '名不符实': 1,
 '后': 1,
 '后面': 1,
 '吗': 4,
 '吧': 3,
 '呢': 1,
 '咋': 1,
 '和': 2,
 '哈哈': 2,
 '哪': 1,
 '哪个': 1,
 '唉': 1,
 '啃': 1,
 '啥': 1,
 '啦': 2,
 '回归': 1,
 '回神': 1,
 '回调': 1,
 '地': 1,
 '地产': 1,
 '块': 1,
 '垃圾': 1,
 '垃圾股': 1,
 '多': 3,
 '多元': 1,
 '大': 4,
 '大底': 1,
 '大盘': 3,
 '大笑': 1,
 '大跌': 1,
 '天天': 1,
 '天风': 16,
 '太': 1,
 '央企科创': 1,
 '头名': 1,
 '套': 1,
 '好': 1,
 '完': 2,
 '完大': 1,
 '完蛋': 1,
 '对': 1,
 '将': 1,
 '小': 1,
 '少': 1,
 '就': 4,
 '尼玛': 1,
 '尽头': 1,
 '庄': 1,
 '应该': 1,
 '废柴': 1,
 '张': 1,
 '当天': 1,
 '彻底': 1,
 '待涨': 1,
 '很': 1,
 '微涨': 1,
 '微笑': 1,
 '德性': 1,
 '心态': 1,
 '总': 1,
 '恶心': 1,
 '想': 1,
 '想涨': 1,
 '慢慢': 2,
 '憨': 1,
 '成交': 1,
 '成功': 2,
 '成本': 1,
 '我': 4,
 '所以': 1,
 '托单': 1,
 '扯': 1,
 '承销商': 1,
 '抄': 1,
 '抄底': 1,
 '把': 1,
 '把跌': 1,
 '担心': 1,
 '拉一波': 1,
 '拉上去': 1,
 '拖累': 1,
 '拿': 1,
 '挂单': 1,
 '捏住': 1,
 '接点': 1,
 '揭秘': 3,
 '撤': 1,
 '改变': 1,
 '放量': 2,
 '无语': 1,
 '无非': 1,
 '日': 3,
 '时候': 2,
 '明白': 1,
 '是': 7,
 '更': 1,
 '最近': 1,
 '月': 4,
 '有': 4,
 '服不服': 1,
 '本事': 1,
 '机会': 3,
 '李连阴': 1,
 '来': 1,
 '来买': 1,
 '板块': 2,
 '欲望': 1,
 '死': 1,
 '每天': 4,
 '比': 1,
 '毛': 3,
 '毛用': 1,
 '永远': 1,
 '没': 2,
 '没有': 1,
 '没爆': 1,
 '沦为': 1,
 '波': 1,
 '流': 1,
 '流出': 1,
 '浪费': 1,
 '浪费时间': 1,
 '涨': 2,
 '涨停板': 1,
 '涨幅': 1,
 '淋漓尽致': 1,
 '清楚': 1,
 '点': 3,
 '点儿': 1,
 '烂票': 1,
 '牛': 1,
 '犯': 1,
 '玩': 2,
 '现在': 1,
 '疑问': 1,
 '疯': 1,
 '疯起来': 1,
 '看出': 1,
 '看好': 1,
 '真是': 1,
 '真的': 2,
 '真难': 1,
 '着急': 1,
 '砸': 5,
 '碎步': 1,
 '礼拜五': 1,
 '票': 1,
 '科': 1,
 '科技': 1,
 '稀土': 1,
 '突变': 1,
 '第': 1,
 '第一': 1,
 '类': 1,
 '红塔': 1,
 '级': 1,
 '终于': 1,
 '绿油油': 1,
 '翻倍': 1,
 '翻红': 1,
 '老大': 1,
 '老套路': 1,
 '老毛病': 1,
 '耗': 1,
 '股': 2,
 '股东': 2,
 '股价': 1,
 '股市': 2,
 '股本': 1,
 '股权': 1,
 '股票': 1,
 '胜利': 4,
 '能涨': 1,
 '脱有': 1,
 '至少': 1,
 '节奏': 1,
 '获': 1,
 '行情': 1,
 '补跌': 1,
 '被评': 1,
 '要': 4,
 '解禁': 1,
 '证券': 11,
 '证券公司': 1,
 '评级': 2,
 '试试看': 1,
 '说实话': 1,
 '谁': 1,
 '货': 1,
 '货光': 1,
 '货色': 1,
 '质押': 2,
 '贪婪': 1,
 '资讯': 1,
 '资金': 3,
 '赚': 1,
 '赚钱': 1,
 '赢': 1,
 '走势': 1,
 '超大': 1,
 '跌太': 1,
 '跌进': 2,
 '跑': 2,
 '跟': 2,
 '跟屁虫': 1,
 '跟着': 1,
 '路': 1,
 '路过': 2,
 '踢': 1,
 '转发': 1,
 '过分': 1,
 '还': 2,
 '还是': 2,
 '还有': 2,
 '还要': 1,
 '这': 6,
 '这个': 2,
 '这么': 1,
 '进': 1,
 '途中': 1,
 '逼': 2,
 '逼挂': 1,
 '那么': 2,
 '部分': 1,
 '都': 2,
 '金融': 1,
 '错过': 1,
 '长城': 1,
 '阳': 1,
 '阴包': 1,
 '阴线': 1,
 '阴跌': 2,
 '陪': 1,
 '难': 1,
 '雷': 1,
 '靠': 1,
 '韭菜': 1,
 '预蕊': 1,
 '领跌': 1,
 '马上': 1,
 '骨头': 1,
 '黄金': 1,
 '龙一': 1,
 '龙二': 1}
# 对字典 按value排序a = sorted(aa.items(), key=lambda x: x[1], reverse=True)print(a)
[('天风', 16), ('证券', 11), ('你', 8), ('今天', 7), ('不', 7), ('是', 7), ('这', 6), ('砸', 5), ('月', 4), ('券商', 4), ('下午', 4), ('大', 4), ('每天', 4), ('要', 4), ('有', 4), ('吗', 4), ('我', 4), ('胜利', 4), ('就', 4), ('07', 3), ('日', 3), ('资金', 3), ('揭秘', 3), ('多', 3), ('单', 3), ('吧', 3), ('上', 3), ('10', 3), ('到', 3), ('大盘', 3), ('主力', 3), ('人', 3), ('不过', 3), ('点', 3), ('又', 3), ('毛', 3), ('机会', 3), ('5', 3), ('为什么', 3), ('买', 2), ('还', 2), ('路过', 2), ('AA', 2), ('评级', 2), ('加仓', 2), ('减仓', 2), ('中国通', 2), ('号', 2), ('成功', 2), ('上市', 2), ('没', 2), ('华林', 2), ('完', 2), ('个', 2), ('会', 2), ('玩', 2), ('和', 2), ('吃', 2), ('卖', 2), ('傻', 2), ('都', 2), ('这个', 2), ('还有', 2), ('涨', 2), ('跌进', 2), ('八块', 2), ('股', 2), ('真的', 2), ('慢慢', 2), ('下跌', 2), ('可以', 2), ('放量', 2), ('啦', 2), ('股市', 2), ('跟', 2), ('板块', 2), ('还是', 2), ('逼', 2), ('买入', 2), ('今年', 2), ('那么', 2), ('时候', 2), ('跑', 2), ('哈哈', 2), ('股东', 2), ('质押', 2), ('阴跌', 2), ('公告', 2), ('几手', 1), ('试试看', 1), ('能涨', 1), ('190626', 1), ('31', 1), ('获', 1), ('2019', 1), ('证券公司', 1), ('类', 1), ('绿油油', 1), ('韭菜', 1), ('地', 1), ('翻红', 1), ('助力', 1), ('科', 1), ('创板', 1), ('不错', 1), ('跟着', 1), ('跌太', 1), ('超大', 1), ('完大', 1), ('中', 1), ('不停', 1), ('出不完', 1), ('货', 1), ('庄', 1), ('很', 1), ('几分', 1), ('一天', 1), ('预蕊', 1), ('临力', 1), ('两块', 1), ('废柴', 1), ('死', 1), ('憨', 1), ('货光', 1), ('脱有', 1), ('毛用', 1), ('票', 1), ('走势', 1), ('完蛋', 1), ('了换', 1), ('长城', 1), ('98', 1), ('想', 1), ('元', 1), ('至少', 1), ('下一', 1), ('波', 1), ('行情', 1), ('应该', 1), ('地产', 1), ('领跌', 1), ('科技', 1), ('先行', 1), ('稀土', 1), ('突变', 1), ('多元', 1), ('金融', 1), ('券', 1), ('933', 1), ('哪个', 1), ('逼挂', 1), ('撤', 1), ('马上', 1), ('把', 1), ('一个', 1), ('疑问', 1), ('流出', 1), ('流', 1), ('垃圾股', 1), ('抄', 1), ('黄金', 1), ('捏住', 1), ('300270', 1), ('好', 1), ('接点', 1), ('最近', 1), ('拖累', 1), ('更', 1), ('过分', 1), ('还要', 1), ('扯', 1), ('路', 1), ('何时', 1), ('尽头', 1), ('服不服', 1), ('从', 1), ('722', 1), ('当天', 1), ('阴线', 1), ('阴包', 1), ('阳', 1), ('看出', 1), ('回归', 1), ('30', 1), ('关系', 1), ('儿子', 1), ('回神', 1), ('解禁', 1), ('18', 1), ('亿', 1), ('天天', 1), ('疯', 1), ('骨头', 1), ('真难', 1), ('啃', 1), ('亏', 1), ('九个', 1), ('被评', 1), ('级', 1), ('名不符实', 1), ('股价', 1), ('比', 1), ('同', 1), ('想涨', 1), ('真是', 1), ('难', 1), ('陪', 1), ('耗', 1), ('无非', 1), ('浪费时间', 1), ('着急', 1), ('套', 1), ('一村', 1), ('恶心', 1), ('哪', 1), ('1', 1), ('2', 1), ('踢', 1), ('乐此不疲', 1), ('赢', 1), ('大笑', 1), ('咋', 1), ('这么', 1), ('不争气', 1), ('呢', 1), ('碎步', 1), ('节奏', 1), ('加油', 1), ('疯起来', 1), ('看好', 1), ('主', 1), ('承销商', 1), ('谁', 1), ('微笑', 1), ('央企科创', 1), ('第', 1), ('尼玛', 1), ('永远', 1), ('跟屁虫', 1), ('做不了', 1), ('老大', 1), ('托单', 1), ('终于', 1), ('唉', 1), ('老毛病', 1), ('犯', 1), ('无语', 1), ('烂票', 1), ('涨停板', 1), ('Sb', 1), ('啥', 1), ('没爆', 1), ('雷', 1), ('将', 1), ('人性', 1), ('贪婪', 1), ('欲望', 1), ('体现', 1), ('淋漓尽致', 1), ('出', 1), ('395', 1), ('成本', 1), ('京东方', 1), ('来买', 1), ('不涨', 1), ('点儿', 1), ('太', 1), ('对', 1), ('拉上去', 1), ('途中', 1), ('说实话', 1), ('没有', 1), ('各', 1), ('以上', 1), ('涨幅', 1), ('依然', 1), ('改变', 1), ('不了', 1), ('下行', 1), ('全仓', 1), ('亏了', 1), ('十三点', 1), ('拉一波', 1), ('现在', 1), ('彻底', 1), ('沦为', 1), ('垃圾', 1), ('卖掉', 1), ('红塔', 1), ('张', 1), ('回调', 1), ('浪费', 1), ('礼拜五', 1), ('叫买', 1), ('赚', 1), ('两', 1), ('翻倍', 1), ('挂单', 1), ('成交', 1), ('少', 1), ('大底', 1), ('三流', 1), ('货色', 1), ('心态', 1), ('不好', 1), ('不要', 1), ('进', 1), ('明白', 1), ('只有', 1), ('赚钱', 1), ('所以', 1), ('不到', 1), ('块', 1), ('待涨', 1), ('靠', 1), ('后', 1), ('了跌', 1), ('头名', 1), ('第一', 1), ('买在', 1), ('944', 1), ('小', 1), ('仓位', 1), ('担心', 1), ('为何', 1), ('老套路', 1), ('出货', 1), ('把跌', 1), ('本事', 1), ('拿', 1), ('出来', 1), ('牛', 1), ('后面', 1), ('去', 1), ('不会', 1), ('补跌', 1), ('资讯', 1), ('5300', 1), ('万股', 1), ('股票', 1), ('占', 1), ('公司', 1), ('总', 1), ('股本', 1), ('102', 1), ('上升', 1), ('德性', 1), ('转发', 1), ('清楚', 1), ('微涨', 1), ('龙二', 1), ('大跌', 1), ('龙一', 1), ('李连阴', 1), ('万万不可', 1), ('错过', 1), ('七块', 1), ('来', 1), ('抄底', 1), ('29', 1), ('601162', 1), ('关于', 1), ('部分', 1), ('股权', 1)]
#二维列表data 转换成dfimport pandas as pd#二维列表#a = [['1','2','3'],['4','5','6']] #列表a中包括两个子列表#转换成dfnews=pd.DataFrame(a)news

.dataframe tbody tr th:only-of-type {        vertical-align: middle;    }    .dataframe tbody tr th {        vertical-align: top;    }    .dataframe thead th {        text-align: right;    }


01
0天风16
1证券11
28
3今天7
47
57
66
75
84
9券商4
10下午4
114
12每天4
134
144
154
164
17胜利4
184
19073
203
21资金3
22揭秘3
233
243
253
263
27103
283
29大盘3
.........
334不会1
335补跌1
336资讯1
33753001
338万股1
339股票1
3401
341公司1
3421
343股本1
3441021
345上升1
346德性1
347转发1
348清楚1
349微涨1
350龙二1
351大跌1
352龙一1
353李连阴1
354万万不可1
355错过1
356七块1
3571
358抄底1
359291
3606011621
361关于1
362部分1
363股权1

364 rows × 2 columns

# 替换标题news.rename(columns={0:'词',1:'频率'},inplace=True)#注意这里0和1都不是字符串news

.dataframe tbody tr th:only-of-type {        vertical-align: middle;    }    .dataframe tbody tr th {        vertical-align: top;    }    .dataframe thead th {        text-align: right;    }


频率
0天风16
1证券11
28
3今天7
47
57
66
75
84
9券商4
10下午4
114
12每天4
134
144
154
164
17胜利4
184
19073
203
21资金3
22揭秘3
233
243
253
263
27103
283
29大盘3
.........
334不会1
335补跌1
336资讯1
33753001
338万股1
339股票1
3401
341公司1
3421
343股本1
3441021
345上升1
346德性1
347转发1
348清楚1
349微涨1
350龙二1
351大跌1
352龙一1
353李连阴1
354万万不可1
355错过1
356七块1
3571
358抄底1
359291
3606011621
361关于1
362部分1
363股权1

364 rows × 2 columns

#保存文件 #解决乱码news.to_excel('news.xlsx',encoding="utf_8_sig")news.to_csv('news.csv',encoding="utf_8_sig")print('ok')
ok

四:数据可视化

import jiebafrom wordcloud import WordCloudimport osimport numpyimport PIL.Image as Image#cur_path = os.path.dirname(__file__)def chinese_jieba(txt):wordlist_jieba = jieba.cut(txt) # 将文本分割,返回 列表txt_jieba = " ".join(wordlist_jieba) # 将列表拼接为以空格为间断的 字符串return txt_jiebastopwords = {'这些':0, '那些':0, '因为':0, '所以':0} # 噪声词#mask_pic = numpy.array(Image.open(os.path.join(cur_path, 'love.jpg')))
import matplotlib.pyplot as plt  #绘制图像的模块#with open(os.path.join(cur_path, '择天记.txt')) as fp:#txt = fp.read()tex = ''.join(line_list) # ''.join(line_list)# 变成一个整体 字符串#tex1=txt = chinese_jieba(clear(tex))print(txt)
今天 买 了 几手 试试看 还 能 涨 不 190626 路过 天风 证券 07 月 31 日 资金 揭秘 天风 证券 获 2019 证券公司 AA 类 券商 评级 绿油油 的 韭菜 地加仓 减仓 加仓 减仓 下午 翻红 天风 证券 助力 中国通 号科 创板 成功 上市 今天 不错 了 没 跟着 华林 跌太多 超大 砸 完大单 砸 大单 砸 完中单 砸 砸 个 不停 每天 出不完 的 货庄 很会 玩 几分 玩 一天 预蕊 和 临力 两块 废柴会 死 憨 货光 脱有 毛用 吃 呀 这票 走势 完蛋 了 换 长城 证券 吧 98 卖 的 路过 想 上 10 元 至少 要 到 大盘 下一波 行情 了 今天 应该 是 地产 领跌 科技 先行 稀土 突变 多元 金融 券 933 哪个 傻 逼 挂 的 不 撤 马上 把 你 吃 了 每天 都 有 一个 疑问 主力 每天 流出 流不完 吗 这个 垃圾股 还有 人 抄 吗 今天 券商 黄金 大涨 捏住 了 300270 跌进 八块 我 好 接点 券商 股 最近 真的 拖累 了 大盘 不过 天风 你 更 过分 还要 扯 跌进 八块 慢慢 下跌 路 何时 到 尽头 服不服 从 722 当天 的 大 阴线 阴包 阳 可以 看出 天风 证券 要 回归 天风 证券 07 月 30 日 资金 揭秘 有 关系 吗 华林 的 儿子 可以 回神 了 10 月 解禁 18 亿天风 天天 疯 这 骨头 真难 啃 亏 九个 点天风 证券 被评 AA 级 券商 真的 名不符实 股价 比 不过 同是 想 涨 真是 难 慢慢 陪 主力 耗 无非 就是 浪费时间 不 着急 今天 又 是 套 一村 人 恶心 哪 1 毛 2 毛 踢 的 乐此不疲 主力 你 赢 了 大笑 你 咋 这么 不争气 呢 这 是 要 碎步 的 节奏 加油 疯起来 我 看好 你 中国通 号 上市 成功 主 承销商 是 谁 啊 微笑 央企科 创第 尼玛 永远 的 跟屁虫 做不了 老大 天风 的 托单 终于 没 了 唉 老毛病 又 犯 了 无语 的 烂票 放量 啦 胜利 胜利 胜利 下午 有 机会 涨停板 胜利 这 Sb 股是 有 啥 没 爆 的 雷 吗 股市 将 人性 贪婪 欲望 体现 的 淋漓尽致 我出 了 395 成本 的 京东方 来 买 的 天风 不涨 点儿 就 太 对 不 放量 了 就是 跟 板块 和 大盘 拉上去 点 还是 下跌 途中 说实话 今天 没有 5 各点 以上 的 涨幅 依然 改变 不了 下行 全仓 亏了 十三点 拉一波 天风 现在 彻底 沦为 垃圾 了 卖掉 红塔 买 了 你 傻 逼 板块 上 啦 你 跟 张 回调 浪费 机会 上 礼拜五 下午 叫 买 的 赚 两毛多 了 买入 今年 翻倍 挂单 那么 多 成交 那么 少 买入 这是 今年 大底 三流 货色 心态 不好 不要 进 股市 要 明白 只有 5 的 人 赚钱 所以 你 不到 10 块 不 卖 待 涨 的 时候 就 靠 后 了 跌 的 时候 头名 第一 买 在 了 944 不过 小 仓位 不 担心 为何 每天 都 老套路 跑 吧 出货 把 跌 的 本事 拿 出来 涨 就 牛 逼 了 今天 又 跑 到 后面 去 了 哈哈 不会 补跌 吧 为什么 为什么 为什么 资讯 天风 证券 大 股东 质押 5300 万股 股票 占 公司 总 股本 102 评级 上升 还 这 德性 转发 还是 阴跌 的 下午 就 清楚 了 天风 还有 5 个 阴跌 微涨 龙二 大跌 龙一 哈哈 天风 证券 李连阴 万万不可 错过 这个 机会 七块 我来 抄底 天风 证券 07 月 29 日 资金 揭秘 公告 601162 天风 证券 关于 股东 部分 股权 质押 的 公告
#需要* 词云包 #pip install wordcloudwordcloud = WordCloud(
   #设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
   #font_path="C:/Windows/Fonts/simfang.ttf",
   font_path="/Users/jiaohaibin/simsun.ttc",  #这个字体文件 需要在 同级目录,否则不显示中文
   #设置了背景,宽高
   background_color="white",width=1000,height=880,
  ).generate(txt)plt.imshow(wordcloud, interpolation="bilinear")plt.axis("off")plt.show()

全部回复

0/140

达人推荐

量化课程

    移动端课程