趣文网 > 作文大全

Python 打造站长工具之软文伪原创工具

2020-11-19 17:40:01
相关推荐

摘要

作为一个站长,在网站日常运营的时候,经常需要写一些软文,以提高网站访问流量,可是作为一个屌丝,文笔肯定没有那么好,想写点文章,可惜肚子里面没有墨水,这个时候,我们肯定想到转载抄袭他人的文章,这样做其实对seo的优化不好,因为不是原创,所以对seo并没有太大的用处,那么怎么办呢?

当然办法还是有的,网上有很多工具关于软文伪原创的工具,我也看了几个,貌似都要收费的,哎,屌丝程序员,没钱.......不过,屌丝的我会编程啊,会python啊...........然后就开始了.........

设计思路

首先,我想做的东西是:本地版的工具,读取txt文件,通过词性分析(动词,名词,代词等),然后提出一类多或多类词性,把他们转化成近义词,根据近义词的相似度,进行选取,然后在组合成新文章。

程序整体运行: 扫描txt文件夹——>读取文件夹中所有txt的内容——>词性筛选近义词分析——>保存数据到新txt

这里呢,我准备选用jieba分词模块和synonyms近义词模块,当然在写程序前,我们应该安装一下这两个模块,jieba这个模块比较容易安装,synonyms这个模块比较大,在cmd中直接安装可能比较费劲,我是在pycharm中完成安装的。

模块的安装

第一步:文件夹扫描及txt读取模块编写

文件夹的扫描,非常容易就利用os模块对文件夹内所有文件扫描一遍,返回list,传递给读取模块进行文章读取,文章读取模块做的事情,就是把txt的中文章标题与内容进行返回,传递给下一个模块;

我这边每个txt的文件都是一样的格式,所以我文章读取模块这边的规则就是采用正则提取,如果你们有需要,可以根据txt内容进行规则改变就可以了;

txt文件的格式

扫描模块和读取模块

第二步:文章词性分析,近义词分析,语句重组模块编写

关于这一部分开发,需要用到两个模块,就是一开始安装的那两个模块,我先直接上代码:

首先是传入句子,通过结巴分词对他进行分词,返回分词信息和词性,然后我们按照一定规则过滤词性,对特定词性进行近义词的筛选,把他们的返回值加入到一个列表,最后把列表通过join()方法进行组合成一句话,后期我们只需要调用这个模块将每句话传入就可以了生成变形后的语句

第三步:txt写入模块编写

这一部分没有什么难点,就是直接将txt的写入到另一个文件

txt写入模块

第四步:逻辑运行入口编写

这个模块是整个程序的逻辑入口,我们首先使用扫描模块,遍历其返回值,依次读取txt文件,将txt文件内容传入到文章变形模块,最后调用txt写入模块,生成一个新的文件,当然新的文件中的内容是经过改变的

逻辑入口

整体代码

代码一

代码二

效果图:

运行图

左边是生成的右边是原来的

总结

总的来说,效果还是很明显的,一个小工具也就是完成了,,,,,,,,,,,,,项目地址:https://gitee.com/Tony.bin/Pseudo_Article.git

阅读剩余内容
网友评论
相关内容
延伸阅读
小编推荐

大家都在看

总会想起 作文 打屁股女作文 英语初一作文 时光的气味作文 作文 放风筝 好书我推荐作文 游棋盘山作文 国家情怀作文 喜欢的动物作文 努力的意义作文 污污的作文 传统作文800字 信任缺失英语作文 秋天在哪里 作文 作文十篇 防电信诈骗作文 童年的趣味作文 作文温暖的旅程 最亲近的人作文 作文我的家人 钥匙作文600字 英语作文高二 平凡作文600字 英语作文报道格式 打女仆屁股作文 小学教资作文 规矩作文300字 值日作文二年级作文 Sp实践作文 坚守规则作文