当前位置: 首页 > news >正文

通州建设局网站惠州seo排名外包

通州建设局网站,惠州seo排名外包,怎么在360网站做词条,vs2005做的网站转换为2012目录标题 前言开发环境:模块使用数据来源分析代码展示获取数据制作词云 尾语 💝 前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 开发环境: Python 3.8 Pycharm 模块使用 requests jieba 结巴分词 wordcloud 词云 第三方模块安装: win R 输…

目录标题

      • 前言
      • 开发环境:
      • 模块使用
      • 数据来源分析
      • 代码展示
        • 获取数据
        • 制作词云
      • 尾语 💝

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

开发环境:

  • Python 3.8

  • Pycharm

模块使用

  • requests

  • jieba 结巴分词

  • wordcloud 词云

第三方模块安装:

win + R 输入cmd 输入安装命令 或 在pycharm中点击Terminal(终端) 输入安装命令

如果出现爆红, 可能是因为 网络连接超时, 可切换国内镜像源,命令如下:

pip install -i https://pypi.doubanio.com/simple/ requests

数据来源分析

明确需求 <数据来源分析>

  • 采集数据是什么东西? 通过那个url地址得到想要数据的内容

  • 抓包分析: 浏览器自带工具 --> 开发者工具

    I. F12 或者 鼠标右键点击检查 选择 network 点击第二页

    II. 复制评论内容, 在开发者工具里进行搜索, 可以直接找对应评论数据包

代码展示

获取数据

1. 发送请求

请求链接

url = 'https://****/comment/productPageComments.action'

请求参数 --> 字典数据类型 构建完整键值对

data = {# 'callback': 'fetchJSON_comment98','productId': '100029079354','score': '0','sortType': '5','page': page,'pageSize': '10','isShadowSku': '0','rid': '0','fold': '1',
}

模拟浏览器 --> headers 请求头

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}

发送请求 requests 模块 get 方法<请求方式>

等号左边: url/params/headers 属于get函数里面形式参数 等号右边 url/data/headers 传入进去参数/变量

response = requests.get(url=url, params=data, headers=headers)

2. 获取数据, 服务器返回响应数据

  • response 响应对象

  • response.text 获取响应文本数据

  • response.json() 获取响应json字典数据

3. 解析数据

字典数据类型: 通过键值对提取数据内容 <字典取值>

for循环遍历 把列表里面元素一个一个提取出来

for i in response.json()['comments']:content = i['content']print(content)

4. 保存数据

with open('口红评论.txt', mode='a', encoding='utf-8') as f:

写入数据内容

    f.write(content)f.write('\n')

制作词云

导入所需模块

# 导入结巴分词  jieba 模块国人开源的
import jieba
# 导入词云
import wordcloud
# 导入读取图片
import imageio
# 读取图片内容
py = imageio.imread('img\\矢量图5.png')

读取文件 返回对象 mode 方式模式 r 读 a追加写入保存 mode 默认是r

f = open('口红评论.txt', encoding='utf-8')

读取内容

text = f.read()

分词 --> 把完整一句话分成很多个单词

string = ' '.join(jieba.lcut(text))

词云图 配置

wc = wordcloud.WordCloud(width=1000, # 宽height=700,  # 高font_path='msyh.ttc', # 词云字体# 设置停用词, 把没有词汇, 停用stopwords={'的', '了', '很', '也'},# 设置背景颜色源码、解答、资源、数据集+V:pytho8987# background_color='pink',contour_width=5,contour_color='pink',mask=py
)

string 数据传入进去

wc.generate(string)

导入词云图

wc.to_file('有形状的词云黑.png')
print(string)

尾语 💝

要成功,先发疯,下定决心往前冲!

学习是需要长期坚持的,一步一个脚印地走向未来!

未来的你一定会感谢今天学习的你。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝

👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

http://www.mnyf.cn/news/53514.html

相关文章:

  • 山东春季高考网站建设烟台网络推广
  • 新开的公司建立网站有哪些要做的网络平台销售
  • 科威网络做网站怎么样google入口
  • 武汉便宜的做网站公司徐州seo外包平台
  • 深圳网站建设网站排名优化网站seo去哪个网站找好
  • 移动端网站建设如何在百度上发布自己的广告
  • 网站开发职业重庆公司网站seo
  • 做计算机网站有哪些内容千锋教育前端学费多少
  • 建设网站的工作免费下载b站视频软件
  • 怎么做网贷网站广东东莞大益队
  • cms可以做多少个网站关键词吉他谱
  • 门户网站建设检察网址查询入口
  • 企业网站建设需求分析seo价格是多少
  • 网站推广预期达到的目标重庆做优化的网络公司
  • 北京做网站电话的公司兰州模板网站seo价格
  • 设计师对网站的意义深圳市seo上词多少钱
  • 傻瓜建站互联网seo是什么
  • 网站集群建设要求怎么做网站推广和宣传
  • 有没有那种帮人做ppt的网站百度seo刷排名工具
  • 哈尔滨网站开发公司韶关疫情最新消息
  • 太原百度搜索排名优化宁波seo服务推广
  • 成都市做网站巩义网站优化公司
  • 行业网站渠道选择和内容运营武汉seo排名扣费
  • 做直播网站软件有哪些手机百度提交入口
  • 素材网站的图可以做海报吗网上接单平台有哪些
  • 做国际贸易如何建网站提高工作效率整改措施
  • 网站首页栏目怎么做谈谈你对网络营销的看法
  • 如何在年报网站上做遗失公告2345浏览器网页版
  • 湘潭县委网站疫情防控最新信息
  • 昆明做网站建设公司广州网站优化服务商