当前位置: 首页 > news >正文

怎么在word里做网站新闻发稿软文推广

怎么在word里做网站,新闻发稿软文推广,武汉网站建设管理登录,开源之家微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 已开源:https://github.com/stay-leave/enhance_llm 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。…

微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。

本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。
已开源:https://github.com/stay-leave/enhance_llm

一、环境准备

Linux环境,GPU L20 48G,Python3.8.10。
pip该库即可。

二、数据准备

该框架实现了读取各种类型的文件,给的示例就是pdf。
在这里插入图片描述
因此准备了一些网络舆情相关的论文pdf,选择70%作为训练数据,剩下作为验证数据。都放在data文件夹下。
在这里插入图片描述

三、微调脚本编写

1.读取数据

使用SimpleDirectoryReader类读取文件。
读取到文本后,使用SentenceSplitter将一个很长的文档切分为若干块。
每一块设置的有token数和重叠token数,在
在这里插入图片描述可以自选,默认的chunk_size大小没找到在哪,重叠的是200.
在这里插入图片描述以上是库的源码实现,我们调用是很简单的。VAL_CORPUS_FPATH 我一开始以为是在load_corpus里的某个类自动保存,结果根本没有。所以自己写了导出为json的函数,是将其text数据保存了。

# 源文件 列表
my_list = [i for i in os.listdir('project_2/data') if i.endswith('pdf')]
# 随机抽取70%的数据,作为训练集
random.shuffle(my_list) # 打乱
num_to_sample = int(len(my_list) * 0.7) # 阈值
# 构造本地文件路径
training_set = [f"project_2/data/{file}" for file in my_list[:num_to_sample]] # 训练集文件list
validation_set = [f"project_2/data/{file}" for file in my_list[num_to_sample:]] # 验证集文件list# 最终形成的训练和验证语料
TRAIN_CORPUS_FPATH = 'project_2/data/corpus/train_corpus.json'
VAL_CORPUS_FPATH = 'project_2/data/corpus/val_corpus.json'# 读取pdf数据,节点
def load_corpus(files, verbose=False):if verbose:print(f"正在加载文件 {files}")reader = SimpleDirectoryReader(input_files=files)docs = reader.load_data()if verbose:print(f"已加载 {len(docs)} 个文档")parser = SentenceSplitter()nodes = parser.get_nodes_from_documents(docs, show_progress=verbose)if verbose:print(f"已解析 
http://www.mnyf.cn/news/52560.html

相关文章:

  • 做社交网站 投入seo的中文含义
  • 网站打不开如何解决seo优化工程师
  • 建设银行网站调用支付源码微信小程序开发
  • 网站整体色彩的建设湖南今日新闻最新头条
  • 哪些网站做翻译可以赚钱什么是网络推广员
  • 网站搭建响应式建立免费个人网站
  • 成都网站软件定制开发seo在线教学
  • 电子商务网站的建设与流程建网站要多少钱
  • 建站公司max网络营销推广要求
  • 做网站,好苦逼阿里云免费域名
  • 广州活动策划公司排名网站关键词排名优化价格
  • 网站设计的人员分工青岛网站排名提升
  • 有没有专门做卡通长图的网站百度快速排名优化工具
  • 徐州泉山区建设局网站品牌营销包括哪些内容
  • dz如何做门户网站外贸推广平台哪个好
  • 定制网站开发的意思如何免费注册一个网站
  • wordpress条件判断关键词seo公司
  • 开一家网站建设公司百度营销推广登录平台
  • 网站建设成功案例方案网络营销的企业有哪些
  • 米思米网站订单取消怎么做黄页网络的推广网站有哪些软件
  • 做网站公司是干什么的seo工资多少
  • 什么网站可以做相册视频公众号怎么引流推广
  • 个人备案可以做门户网站吗优化搜索曝光次数的方法
  • 昆明做门户网站的公司百度官方版下载
  • 做网站遇到竞争对手怎么办真正免费的建站
  • 百度商桥网站代码去哪里添加软文范例
  • 万柳网站建设seo教程视频
  • 网站开发概述无锡网站建设seo
  • 炫酷网站欣赏网络营销专业学什么课程
  • 网站后台显示不全图们网络推广