中国会计视野论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

查看: 5358|回复: 2

[经验] RSS和Python网络爬虫学习笔记(一)

[复制链接]
发表于 2021-6-2 23:43:57 | 显示全部楼层 |阅读模式
  6折考取CMA认证,引领职业新未来
CMA最新资讯号“CMA订阅号”上线
IMA-复旦大学校园管理会计案例大赛启动
CMA是您挖掘职业潜能的通关秘钥
 

视野思享会年费会员
一年内免费直播参与
历届活动视频回放
与爱学习群体共同成长

 

欢迎订阅会计视野微信公众号
第一时间了解最新财会知识
碎片化学习新方法
200万读者追随的真爱选择。

RSS和Python网络爬虫学习笔记(一)
目录
一、RSS简介
二、使用RSS的原因
三、使用RSS的工具准备
四、使用RSS的过程-以订阅国家发展与改革委员会要闻为例
五、RSS订阅的不足-Python来补充
六、Python简介
七、Python学习准备
八、Pyhton基础编程知识
九、Python学习过程-以抓取北京注册会计师协会专家委员会提示为例
十、未来展望
十一、参考文献

十二、附录-历年北京注册会计师协会专家委员会提示

个人微信公众号:思源资讯,欢迎大家点击下方二维码关注
思源二维码头像.jpg
最近一周,主要着力于自己的信息源管理,学习了利用RSS进行信息源聚合(FEEDLY网站+APP),为了弥补RSS的不足,自学了Python网络爬虫进行信息抓取,以下文章是自己的学习记录。
一、RSS简介
    维基百科对于RSS的简介是RSS(全称:RDF Site SummaryReally Simple Syndication[2]),中文译作简易信息聚合,也称聚合内容,是一种消息来源格式规范,用以聚合经常发布更新资料的网站,例如博客文章、新闻、音频或视频的网站。简单来说 RSS 能够让用户订阅个人网站个人博客,当订阅的网站有新文章是能够获得通知。
目前热门的RSS阅读器有Feedly、Inoreader、Reeder、The Old Reader(使用浏览器或者APP进行阅读)。历史上有名的RSS有Google Reader等,可惜GoogleReade于2013年7月15日已终止服务[1]。
二、使用RSS的原因
为什么会想到使用RSS,因为个人关注的信息来源比较多,但每日精力有限,特别是年审期间,疲于工作,有时真正需要的信息来不及看,或者被遗漏,或者不知道今日该网站是否更新信息,到后期也许已经陷入信息疲劳状态,所有有益的信息源都懒得主动去点开查看更新,每日只主动去点击1到2个自己感兴趣的公众号或者网站,剩余的饭后睡前时间会漫无目的刷刷B站的首页推荐或者QQ的看点推荐(微博、抖音已被自己卸载)。原本以为卸载微博、抖音后会更新专注一些业务方面的信息源,但人的天性是追求舒适的,紧张的工作后似乎终究会去寻找一丝闲暇,原本被微博、抖音占据的时间空出来后,居然不自觉的去刷新QQ的看点推荐,这样每天自己都处于熵增状态,熵增这个词最近一次看到是在《任正非在荣耀送别会上的讲话》,文中任总提到”坚持奋斗的目标与方向,坚持有所为、有所不为,坚持创新不动摇,绝不允许队伍熵增”。熵增意味着无论是人与自然、组织还是系统,都有一个朝向毁灭发展的趋势,如果不加以干预,就会加速进行。而熵减,则意味着我们与外界进行物质和能量的交换,在耗散过程中产生负熵,从原来的无序状态转变为新的有序状态。周易中提到“君子终日乾乾,夕惕若厉,无咎”。使用RSS,从被动接受信息轰炸到有选择的主动管理信息来源,是实现熵减的一个途径。
三、使用RSS的工具准备
        对于国内的读者来说,有个坏消息就是目前热门的RSS阅读器(FeedlyInoreaderReeder)等都已经被墙掉了,如果读者想要使用这些服务,必须首先进行科学上网(fanqiang),目前的大环境下比较稳定的还是付费VPN,每年几百块钱对于大家来说还是比较值得的。
        能够科学上网以后,推荐大家直接使用feed43网站(https://feed43.com/)来制作自己的RSS订阅源,使用Feedly进行订阅(https://feedly.com/),feedly既可以在电脑网页端进行阅读,也可以在手机端下载APP进行阅读,对于IOS用户来说,国内App StoreFeedly 应用已经下线,只有北美地区用户的App Store可以下载,在此推荐大家除了国内的Apple ID以外,可以再注册一个北美地区的Apple ID(教程大家可以自行上网搜索),因为北美地区的APP Store是各种应用最齐全的,将VPN登录地区设置为美国,苹果手机上登录北美地区Apple ID以后,就可以在App Store中下载Feedly App了,还有一款口碑很高的阅读App Reeder 5,需要付费4.99美元,约30多元人民币,但是好像无法通过国内的银行卡或者支付宝、微信进行购买,笔者尝试后就作罢了,还是专心使用我的免费Feedly App吧。
        关于如何制作知乎、简书、微博、豆瓣的RSS源,可以参考《如何克制并高效获取信息,不被碎片化信息所困扰》[1](作者nigo,微信公号:逆行的狗),关于如何Feed43的详细用法,大家可以参考《利用 Feed43,将任意网页制作成 RSS 订阅源》[2](作者: huhuhang,网站:少数派)
1.png
2.png
3.png
                                
四、使用RSS的过程-以订阅国家发展与改革委员会要闻为例     
        本段中,我们将以订阅国家发展与改革委员会要闻为例,来展示如何使用Feed43制作订阅源,并使用Feedly进行订阅。
第一步:指定源页面地址
复制国家发改委新闻发布页面的网址https://www.ndrc.gov.cn/xwdt/xwfb/,然后打开feed43网站,并点击“Create your own feed”开始创建订阅源,然后将网址复制到Step1下面的address中,后面的Enconding可以填写utf-8,不然有时会出现中文乱码,然后点击Reload,开始加载网页源码,可以看到下面的Page Soure中出现了网页源码。   
4.png    
第二步:定义提取规则
选取复制重复出现的新闻节点如<li><a href="./202105/t20210525_1280783.html"target="_blank" title="国家发展改革委有关负责同志就《“十四五”时期深化价格机制改革行动方案》答记者问">国家发展改革委有关负责同志就《“十四五”时期深化价格机制改革行动方案》答记者问</a><span>2021/05/25</span></li>,粘贴到Global Search Pattern(optional)下面的方框中,将herf、title、span字段后对应的网址、标题、时间变量统一替换成{%}表示,每行代码换行处可以加上{*},点击Extract,方框下文中出现”OK (20 items found)”,显示找到了20篇文章,其中{%1}、{%2}、{%3}、{%4}分别代表文章的网址、标题、时间。
5.png
6.png

        第三步:定义输出格式
        定义输出格式中又分为两小块,第一块是定义RSS源的属性,如RSS源的标题,链接,文本描述等,第二块是RSS项目的属性,其中项目标题是自定义格式的,延续第二步中的{%1}=网址,{%2}{%3}=标题,{%4}=时间,加入项目标题我们想用标题+时间的格式,那么在Item Title Template*这一行下面就可以{%2} | {%4}或者{%2}+{%4}{%2}{%4}等任意自定义格式显示,Item Link Template*:填写项目的网址链接,这里填写{%1},然后点击Preview,出现Your Feed is ready,就表示一切搞定了。下方出现预览RSS源格式,并生成RSS源网址和RSS源编辑网址,RSS源网址可以直接利用FeedlyInoreaderReeder 等进行订阅,RSS源编辑网址希望大家也能收藏好,万一后面想要重新编辑RSS项目格式,可以直接点击修改(之前的范式已自动填充),不然就要重新手工填写第一步和第二步。
7.png
8.png
9.png
10.png
第四步:在Feedly网站中添加RSS订阅源
打开Feedly网站(https://feedly.com/),注册登录后,点击页面最左侧的“+”号,在跳出的Discover the best sources for any topic下方的框中,输入Step 3中生成的Feed URL, https://feed43.com/5157577881141118.

xml,稍等1-2秒,下方会自动跳出Sources:发改委-要闻栏目,点击右侧的Following,订阅即可完成。当每天你的订阅源更新内容时,左边的列表中都会用数字显示未阅读的更新的数量,点击阅读后,数字会消失,这样我们就可以主动及时的管理我们感兴趣的内容了。
11.png

12.png

13.png
五、RSS订阅的不足-Python来补充
经过笔者这几天的亲测,大多数静态HTML网页都可以通过feed43进行订阅源制作,如中国证监会、财政部、中注协之类的新闻类页面,但是像以下几个页面经过Feed43的源码解析后,无法找到目标文章标题对应的代码模块,html源码只有网页界面格式化的顶端、侧边、底端标题代码,这也推动了我去寻找替代解决方案的想法,能不能自己做个爬虫程序,定期去爬取这几个页面的更新情况,想到目前比较流行的编程语言是Python,那就干起来吧,这里还要感谢nigo大神(微信公号:逆行的狗),之前看他的一系列Python学习与实践的文章已经对Python很向往,加之自己目前也有这个需求,那就着手干吧。
l  北京注协会计师协会专业技术委员会专家提示http://bicpa.org.cn/zyfwz/zyfw/zzyzd/index.html
l  浙江注册会计师协会专业技术委员会专家提示http://www.zicpa.org.cn/BusinessManage/BusinessManageProfessionCouncil/ProfessionCouncilteach/index.html
l  中国证券监督管理委员会行政处罚决定
http://www.csrc.gov.cn/pub/zjhpublic/index.htm?channel=3300/3313
l  上海证券交易所监管信息公开
http://www.sse.com.cn/disclosure/credibility/supervision/measures/
l  深圳证券交易所中介机构监管公开
http://www.szse.cn/disclosure/supervision/supervise/index.html
回到本文,直到后来我学习了Python相关知识后,我才意识到Feed43的不足之处在于它只能对于静态的html文档进行抓取分析,而如果浏览器中的页面是经过JavaScript 处理数据后生成的结果时,Feed43就无能为力了。这里要引用一下崔庆才老师对JavaScript的描述:
l  网页可以分为三大部分 ——HTML、CSS 和 JavaScript。如果把网页比作一个人的话,HTML 相当于骨架,JavaScript 相当于肌肉,CSS 相当于皮肤,三者结合起来才能形成一个完善的网页。[4]
l  有时候我们在用 requests 抓取页面的时候,得到的结果可能和在浏览器中看到的不一样:在浏览器中可以看到正常显示的页面数据,但是使用 requests 得到的结果并没有。这是因为 requests 获取的都是原始的 HTML 文档,而浏览器中的页面则是经过 JavaScript 处理数据后生成的结果,这些数据的来源有多种,可能是通过 Ajax 加载的,可能是包含在 HTML 文档中的,也可能是经过 JavaScript 和特定算法计算后生成的。
对于第一种情况,数据加载是一种异步加载方式,原始的页面最初不会包含某些数据,原始页面加载完后,会再向服务器请求某个接口获取数据,然后数据才被处理从而呈现到网页上,这其实就是发送了一个 Ajax 请求。
照 Web 发展的趋势来看,这种形式的页面越来越多。网页的原始 HTML 文档不会包含任何数据,数据都是通过 Ajax 统一加载后再呈现出来的,这样在 Web 开发上可以做到前后端分离,而且降低服务器直接渲染页面带来的压力[5]。
从上面的描述中可以看出,Feed43的原理应该是直接用requests函数去抓取网页的原始HTML文档,对于异步加载的数据,它不会做进一步处理。所以我们可以Python去弥补这个不足。
六、Python简介
        Python是在19世纪80年代由Guido van Rossum提出(吉多·范罗苏姆, 1956131日-, 生于荷兰哈勒姆),在1991年正式首次发布。Python是通用的、高级的编程语言,支持多范式编程以及具有很强的可扩展性。Python语言注重的是代码的可读性,放弃了繁琐的语法,从而使其成为更为简洁、实用的语言。
相对于其他语言,Python有如下特点:(1)与其他计算机语言良好的互通性。Python语言可以很方便的接入像Java等其他语言程序,因此在软件开发中经常应用到Python构建框架,再将计算性能要求高的模块用C或C++写入,最终嵌入到Python框架中,这样处理可以大大提高开发效率;(2)丰富的第三方工具包。有优化设计工具Optimizer、科学计算包如Numpy、Scipy等、Tensorflow、Scikit learn等这些优秀的第三方包使得Python并不逊色于Matlab等传统计算软件;(3)良好的代码规范性。Python语言中大量的使用了英文,并且使用强制空白符来区分代码块之间的关系,使得Python代码更为美观而且易读;(4)有效的内存管理。Python运行是环境处理所有的python对象的垃圾收集;(5)Python的异常处理。Python几乎所有的错误都会提示异常[6]。
七、Python学习准备
        1、关于Python的书
        在进行Python编程之前,我们先要进行Python软件安装,并安装相关的第三方库,笔者购买了一本崔庆才老师的书《Python 3网络爬虫开发实战》(当当网链接,http://product.m.dangdang.com/25249602.html?t=1622184762),这本书首先介绍了环境配置和基础知识,然后讨论了urllibrequests、正则表达式、Beautiful SoupXPathpyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,然后介绍了pyspider框架、Scrapy框架和分布式爬虫。其中大多数内容之前都发布在崔老师的博客上,大家感兴趣也可以点击博客查看(https://cuiqingcai.com/categories/Python/),书中的Python源码在https://github.com/Python3WebSpider上也可以看到。
        2、关于Python的网站
在崔老师的博客上,他还推荐了其他几位老师的Python学习课程,比如
l  廖雪峰 Python 教程 网址:https://www.liaoxuefeng.com/wiki/1016959663602400
l  简明Python教程
网址:https://www.woodpecker.org.cn/abyteofpython_cn/chinese/index.html
        经过笔者安装Python后进行爬虫实践的血泪史来说,CSDN网站真是救命良药啊,上面有很多技术人员的博客,保罗万象,基本上笔者遇到的绝大多数问题都能在上面搜索后找到答案
l  CSDN  网址:https://www.csdn.net/
笔者在折腾的过程中,产生了不少版本的代码,如何进行保存和管理呢,这里推荐下Github网站,GitHub是通过Git进行版本控制的软件源代码托管服务平台,2008年4月正式上线,2018年6月4日,微软宣布以75亿美元的股票收购GitHub。
l  Github  网址:https://github.com/
3、浏览器
推荐大家使用Chrome浏览器或者Firefox浏览器,里面的开发者工具功能非常强大,能让大家在抓包的过程中省力不少。
八、Pyhton基础编程知识
由于笔者这次学习Python的目的比较明确,就是去抓取北京注册会计师协会专家提示的网页信息,所以一开始上来就是按照书中成熟的案例撸代码,在战争中学习战争,跳过了前面的基础知识环节,结果在运行程序中出现了各种bug,通过不断的Google+百度,才慢慢的解决问题。所以在此我把自己遇到的坑小结一下,前事不忘后事之师。
(1)python终端、python解释器、python编辑器三者是不同的。
笔者一开始不太清楚python终端、解释器、编辑器的区别,查阅后弄清楚了,python终端可以通过右键开始,点击运行,输入cmd打开,或者点击开始》Anaconda3》Anaconda Prompt 打开,有时在书里python终端会被简称为命令行,比如说在命令行中输入pip install 或者 pip3 install命令来安装某个包
python解释器可以通过在python终端输入python来打开,成功后,在左侧会出现三个箭头,这里使用的是Python自带的CPython解释器,也被称为Python命令行交互模式,一般教程的开头会在这里输入import命令来验证某个包是否安装成功,如果不报错,说明一般安装成功了。
    因为python解释器无法保存你编写的代码,所以又衍生出了可以保存代码的python文本编辑器,比如微软的Visual Studio Code,笔者自己装的也是这款。
14.png
15.png
16.png
(2)缩进
Python语言利用缩进表示语句块的开始和结束增加缩进表示语句块的开始,而减少缩进则表示语句块的结束。根据PEP 8 -- Style Guide for Python Code[7]的规定,使用4个空格来表示每级缩进。
笔者一开始在编程的时候,没有注意到这个规定,在使用def、if、with函数时一直报错,出现expected an indented block的报错,后来使用Tab键往里缩进一下就可以运行了。在文本编辑器中,我们需要设置把Tab自动转换为4个空格,确保不混用Tab和空格。
(3)字符编码
笔者在用Visual Studio Code运行编码的时候,刚开始还会跳出UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in positionXX的错误,后来在网上查了查,是因为python的默认编码不是’utf-8’, 改一下python的默认编码成'utf-8'就行了。添加以下几行代码解决问题
import io
import sys
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')
一些常见的和中文有关的编码名称有utf-8-所有语言、gbk-简体中文、gb2312-简体中文、gb18030-简体中文,big5-繁体中文,big5hkscs        -繁体中文。[8]
(4)数据类型
笔者在运行程序过程中还遇到TypeError: expected string or bytes-like object的错误,这是因为数据类型不匹配造成的。Python3中有六个标准的数据类型:Number(数字)、string(字符串)、List(列表)、Tuple(元组)、Sets(集合)、Dictionary(字典)。可以通过print(type(object))来查当前的数据类型,式中object为要查询的对象[9]。
(5)输入输出
笔者最后遇到的问题是如何保存爬取到的数据,阅读了廖雪峰老师的教程如下:我们可以调用open、read、write函数来进行读写,但是务必要调用f.close()来关闭文件。当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with语句来得保险[10]
f = open('/path/file', 'a')
f.read()
f.write('Hello, world!')
f.close()
with open('/path/file ', ' a ') as f:
    f.write('Hello, world!')
九、Python学习过程-以抓取北京注册会计师协会专家委员会提示为例
        在抓取北京注册会计师协会专家委员会提示的一开始,我使用的request.get()方法,结果一直返回{success:true,datas:[],total:0},没有其他信息。按照《Python3 网络爬虫开发实战》的提示,我已经在开发者工具》XHRnamegetArticles.actionResponse下看到类json格式的当页专家委员会标题提示数据,但是request.get()方法就是提取不出来,百思不得其解之下,在CSDN搜索北京注册会计师协会,居然搜索到一篇名为《python解析json传入变量_Python爬虫爬取会计师协会网站的指定文章(实例57)》的文章(作者譞而翾)[11],看了之后真是醍醐灌顶,原来我们登录北注协网站时客服端向服务器发出的请求方法用的Post请求,而不是Get请求,因此我们应该使用requests实现Post请求,即利用request.post()方法。
1、抓取分析
我们首先在Chrome浏览器中输入http://bicpa.org.cn/zyfwz/zyfw/zzyzd/index.html,进入北京注册会计师协会网站》专业服务》注册会计师》专业指导页面,然后按F12键打开开发者工具页面,再在左边网站页面点击刷新,然后点击开发者工具页面中的Network,点击下方的all,观察到下方的name界面出现了很多进程
17.png
  这时我们选择name栏中的index.html进程,点击右边的headers,观察到其中显示的Request Method为get,显示似乎我们似乎可以通过request.get()方法获取网页源代码
18.png
但是当我们打开  Response栏目,按下ctrl+f打开全局搜索,输入左边页面文章标题中包含的“专家提示”四个字,返回搜索结果却为0,显示当前页面的html代码中不包含“专家提示”这4个字,这时我们再点击左边页面中的下一页,发现网址依旧为http://bicpa.org.cn/zyfwz/zyfw/zzyzd/index.html,没有发生任何变化,我们可以初步判断翻页时,网页是异步加载的。
19.png
20.png
我们再点击Network》XHR》Name,再选择最下面的getAtricles.action,点击右边的Headers,可以看到RequestMethod为Post,证明是Post请求方法,在Header界面中向下滑动滚动条,可以看到Request Headers栏中的X-Requested-With内容为XMLHttpRequest(缩写为XHR,也就是我们刚才点击的Network下面的XHR),标记了此请求为Ajax请求,Ajax全称为Asynchronous JavaScript and XML(异步的JavaScript 与XML技术),AJAX 最大的优点是在不重新加载整个页面的情况下维护数据[11],并更新部分网页内容。
21.png
22.png
  我们在刚才的页面下点击Response,即可发现其中蕴含了左边页面文章的标题、日期等必要信息。
23.png
这时我们回到header页面,继续向下滑动鼠标,可以看到Form Data,这个就是数据提交格式了。页面1的getAtricles.action,对应的是start1:1,limit:15,正好与第一页中的15篇文章相对应,我们点击下一页,发现name栏中出现了第二个getArticles.action,点击查看其对应Header中的FormData,对应的是start:15,limit:15,说明start表示文章的开始数,limit表示每页文章的最多数,这样我们就可以通过改变start和limit的值来获取我们想要的文章数量了。
24.png
25.png
2、抓取过程
先用import导入requests、json、pandas模块,因为发送网页请求、读取网页数据、存储网页数据分别涉及到这三个模块,然后为了防止python显示中文时会经常提示gbk编码错误, 改变标准输出的默认编码为utf-8,需要导入io和sys模块进行初始设置。
26.png
然后定义一个header,可以将开发者工具界面中的Headers界面中的User-Agent的信息复制过来,目的是为了将我们的程序伪装成一个浏览器,防止对方服务器发现我们是爬虫程序而拒绝访问。
27.png
28.png
接下来我们定义一个名为“form_data”的字典,用来储存从
开发者工具中的Form Data复制过来的数据,其中start和limit的值注意要是整数格式,不能加字符窜,所以不加单引号,这里我们观察一下专业服务》注册会计师》专业指导页面最下方的记录,发现是134个,因此我们这里就将limit设置为135,一次性获取所有文章,而不是像每页显示中的limit=15那样,以15为一段来显示文章,然后将start设置为1。
29.png
然后将开发者工具界面》Headers》General》Request URL复制过来,赋值给url,然后调用requests.post(),传入url,data和headers参数,开始获取URL中的文本,设置打印观察其格式。
30.png

31.png

我们观察大以上输出内容是一个非常大的json字符串,里面存着134篇文章的基本信息。这里我们从廖雪峰老师那里学习一下json的基本知识[13]。
如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。
JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:
JSON类型
Python类型
{}
dict
[]
list
"string"
str
1234.56
int或float
true/false
True/False
null
None
我们观察到上面输出的json字符串内部的数据类型是主体是方括号[]和花括号{}组成,即对应着Python的列表和字典类型数据。
如果要将这个json字符串转为python能够直接识别的列表,必须将开头的{success:true,datas:和结尾的,total:134}去掉才能够进行。
32.png
33.png
这里我们要用到split函数对字符串进行切割,split()函数,语法:str.split(str="",num=string.count(str))[n],参数说明:str:表示为分隔符,默认为空格,但是不能为空('')。若字符串中没有分隔符,则把整个字符串作为列表的一个元素,num:表示分割次数。如果存在参数num,则仅分隔成 num+1 个子字符串,并且每一个子字符串可以赋给新的变量,[n]:表示选取第n个分片[12]。
34.png
切割完成后,我们就得到一个新的json字符串,由1个大的obejcet{}和其内部的多个array[]组成,array[]内储存着每篇文章的基本信息。那我们如何将json格式转换为python对象呢,这时需要用到Python内置的json模块,将字符串article_data传入json.loads()即可完成转换,这里我们把转换后的数据存入obj,利用print函数查看obj的数据类型和长度。
35.png

36.png
可以看到输出结果为list,即Python的列表格式,列表长度为134,正好和专业服务》注册会计师》专业指导下的文章总数相对应。
36-1.png
然后我们开始分析list中每个字典的内部结构,分析我们要抽取哪些数据,可以把list中第一个字典打印出来参考一下
37.png

38.png
  


其中title和publishdate分别代表我们所需要的文章标题、发布日期,但是文章的完整的URL是如何构成的呢,在网页中点击打开“北京市科技计划项目(课题)工作任务验收(结题)经费审计实务操作指引”这篇文章,发现其完整链接为http://bicpa.org.cn/zyfwz/zyfw/zzyzd/sj/B161041569607127.html,由http://bicpa.org.cn/+字典中的url: /zyfwz/zyfw/zzyzd/sj/+字典中的primaryKey:B161041569607127+html,所以综合来看,字典中的title、publishDate、primaryKey和url就是我们要提取的信息,分别代表文章标题、发布日期、文章链接编号、文章链接。
39.png
40.png

41.png
由于北注协》专业服务》注册会计师》专业指导下的文章还包括一些非委员会专家提示的文章,所以我们要用if语句将含有专家提示的文章信息挑选出来,存储到变量article中(数据类型:字典),再将字典变量article存储到列表变量articles。然后打印前3项,查看效果如何。
从输出结果中可以看到,我们想要的信息都已经包含在其中。
3、存储结果
爬虫抓取结果出来后,我们可以选择文件的存储方式,python提供的存储方式多种多样,有TXT、JSON、CSV等,另外还可以保存到数据库中,如关系型数据库 MySQL,非关系型数据库 MongoDB、Redis。因为笔者目前功力尚浅,对于数据库没有实践过,而且txt不便于编辑和排序等,因此,笔者在这里选择调用pandas库将数据存储为CSV格式。设置列标题为”标题、发布日期、链接”,行索引从1开始。
42.png
打开生成的CSV文件,看到北京注协专家提示的文章已经存放在各列中,从2013年12月5号到2021年1月8号,共83条,在EXCEL中直接双击链接即可访问对应网页。
43.png
   
44.png
    但是如果我们细心观察一下,会发现专家提示[2020]第7号和第8号是缺失的,这是为什么呢,我们在注册会计师行业法律法规库(https://cicpa.wkinfo.com.cn/)中搜索到《北京注册会计师协会专业技术委员会专家提示[2020]第7号——穿透检查在防范财务舞弊中的适当应用》是2020年12月9号发布的,因此我们到北京注协》首页》动态聚焦》最新公告下翻到2020年12月9号,果然有这篇文章。
45.png
46.png
因此,我们要考虑更换程序中的提交的Form Data数据,在当前页面按下F12键,然后查看开发者工具》Network》XHR》Headers的Form Data,其siteld是7e0b3b27-2622-4aa7-b6f8-abfe5c5df922,catalogld是34f92da3-d6d0-4e96-899f-d7f581c18162,和上文中的北注协》专业服务》注册会计师》专业指导页面的siteld数据相同,但是catalogld数据不同,因此我们判断如果要抓取完整版的北京注册会计师协会专业技术委员会专家提示,要修改catalogld数据为34f92da3-d6d0-4e96-899f-d7f581c18162,同时limit修改为最新公告中的文章总数5207,然后重新运行程序。
47.png
48.png
49.png
结果发现一共得到96篇文章,比刚才爬行得到的83篇文章多了13篇,同时专家提示[2020]第7号、第8号都已经在结果列表中,说明这一次北注协专家提示的爬行结果是比较完整的。
十、回顾与未来展望
1、回顾
由RSS订阅中Feed43网站无法烧制北京注册会计师协会等网站订阅源的不足,我萌生了自学Python来编写爬虫抓取信息的想法,说干就干,买来了《Python 3网络爬虫开发实战》这本书,开始直接参照案例编写代码,在Python程序一次次出现bug与痛苦解决bug的过程中,慢慢的开始了解Python爬虫相关的基础知识,最终成功抓取到了北京注册会计师协会专家委员会提示所有文章的标题、发布日期与网址链接。
2、未来展望
这一次抓取北注协文章的不足是笔者暂时还未掌握将每篇文章的文本内容单独保存为WORD或者PDF,仅仅是获取了标题与链接,下一步学习的方向
(1)了解与掌握Python的docx、panda、IO模块,学习运用Python处理Word与Excel,为Python爬虫内容的存储打好基础。
(2)将Feed43网站中无法添加的RSS信息源,统一编写到一个Python爬虫程序中,再使用WIN10自带的定时任务程序,每天实现Python脚本的自动运行抓取保存。
十一、参考文献
[1]维基百科.RSS[EB/OL].[2018-05-15].https://zh.wikipedia.org/wiki/RSS,2018-05-15
[2]nigo.如何克制并高效获取信息,不被碎片化信息所困扰[EB/OL].[ 2018-09-12
].https://mp.weixin.qq.com/s/vxNAwUYPM7VZSooCqiv7bg
[3]huhuhang. 利用 Feed43,将任意网页制作成 RSS 订阅源 | 一日一技[EB/OL]. [2016-05-23].https://sspai.com/post/34320 
[4]崔庆才. [Python3 网络爬虫开发实战] 2.2-网页基础 [EB/OL].[2018-01-26]. https://cuiqingcai.com/5476.html
[5]崔庆才. [Python3 网络爬虫开发实战] 6-Ajax 数据爬取 [EB/OL].[2018-01-30]. https://cuiqingcai.com/5590.html
[6]李建飞. 基于Python 的代理模型优化平台设计及应用[D].大连理工大学硕士论文,2019:19
[7] Guido van Rossum, BarryWarsaw, Nick Coghlan. PEP 8 --Style Guide for Python Code[EB/OL].[2013-08-01]. https://www.python.org/dev/peps/pep-0008/
[8] jim7424994. 解决python3UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX[EB/OL].[2014-03-31]. https://blog.csdn.net/jim7424994/article/details/22675759
[9] yekingyan. Python正则表达式时出现TypeError: expected string or bytes-like object[EB/OL].[2018-05-21]. https://blog.csdn.net/weixin_42105977/article/details/80390957
[10]廖雪峰. 文件读写[EB/OL].[2015-06-01] https://www.liaoxuefeng.com/article/1019078500152800
[11] 维基百科.AJAX [EB/OL].[2021-05-10]. https://zh.wikipedia.org/wiki/AJAX
[12] 灵也有希望. python split函数详细用法[EB/OL].[2021-01-14]https://blog.csdn.net/weixin_32557927/article/details/112937999
[13] 廖雪峰.序列化[EB/OL]. [2015-06-01]. https://www.liaoxuefeng.com/wiki/1016959663602400/1017624706151424
关注大家关注微信公众号“思源资讯”,有什么想法可以给我发消息。

十二、附录-
历年北京注册会计师协会专家委员会提示
 
标题
发布日期
链接
1
北京注册会计师协会专业技术委员会专家提示[2021]第1号——注册会计师对收入准则新旧衔接的特别关注
2021-3-8 10:33
http://www.bicpa.org.cn/dtzj/zxgg/B161517076513525.html
2
北京注册会计师协会专业技术委员会专家提示[2020]第9号——国有境外资产检查
2020-12-31 15:51
http://www.bicpa.org.cn/dtzj/zxgg/B16093991124235.html
3
北京注册会计师协会专业技术委员会专家提示[2020]第10号——注册会计师执行财务共享咨询的提示
2020-12-31 15:51
http://www.bicpa.org.cn/dtzj/zxgg/B16093993306286.html
4
北京注册会计师协会专业技术委员会专家提示〔2020〕第11号—上市公司重组需关注事项
2020-12-31 15:51
http://www.bicpa.org.cn/dtzj/zxgg/B16093995441527.html
5
北京注册会计师协会专业技术委员会专家提示〔2020〕第8号——对联合国可持续发展目标收入贡献的有限保证鉴证
2020-12-23 11:33
http://www.bicpa.org.cn/dtzj/zxgg/B16086943008772.html
6
北京注册会计师协会专业技术委员会专家提示[2020]第7号——穿透检查在防范财务舞弊中的适当应用
2020-12-9 13:54
http://www.bicpa.org.cn/dtzj/zxgg/B16074931343122.html
7
北京注册会计师协会专业技术委员会专家提示〔2020〕第6号—经济责任审计与违规责任追究
2020-12-1 13:30
http://www.bicpa.org.cn/dtzj/zxgg/B16067248689046.html
8
北京注册会计师协会专业技术委员会专家提示〔2020〕第5号——注册会计师参与反舞弊调查
2020-11-4 16:04
http://www.bicpa.org.cn/dtzj/zxgg/B16024701568132.html
9
北京注册会计师协会专业技术委员会专家提示〔2020〕第4号—非持续经营的审计关注
2020-6-24 11:29
http://www.bicpa.org.cn/dtzj/zxgg/B15929693097193.html
10
北京注册会计师协会专业技术委员会专家提示〔2020〕第3号——对新金融准则下减值准备的关注
2020-5-25 15:20
http://www.bicpa.org.cn/dtzj/zxgg/B15903912099325.html
11
北京注册会计师协会专业技术委员会专家提示[2020]第2号—采用远程审计方式的特别考虑
2020-2-12 16:53
http://www.bicpa.org.cn/dtzj/zxgg/B15814976145963.html
12
北京注册会计师协会专业技术委员会专家提示[2020]第1号—金融准则新旧衔接中注册会计师的特别关注
2020-1-19 15:15
http://www.bicpa.org.cn/dtzj/zxgg/B15794181161112.html
13
北京注册会计师协会专业技术委员会专家提示[2019]第8号—实施存货监盘的重点关注事项
2019-12-30 14:03
http://www.bicpa.org.cn/dtzj/zxgg/B15776856918365.html
14
北京注册会计师协会专业技术委员会专家提示[2019]第7号—对上市公司环境、社会及管治报告(ESG报告)实施的工作
2019-12-18 11:35
http://www.bicpa.org.cn/dtzj/zxgg/B15766400436118.html
15
北京资产评估协会维权委员会专家提示[2019]年第1号——资产评估委托合同风险提示
2019-12-9 14:32
http://www.bicpa.org.cn/dtzj/zxgg/B15758731013681.html
16
北京注册会计师协会专业技术委员会专家提示[2019]第6号—破产重整程序中共益债务识别及应对
2019-11-12 16:02
http://www.bicpa.org.cn/dtzj/zxgg/B15735456021523.html
17
北京注册会计师协会专业技术委员会专家提示[2019]第5号—利用税务专家的工作
2019-10-17 11:00
http://www.bicpa.org.cn/dtzj/zxgg/B157128111752919.html
18
北京注册会计师协会专业技术委员会专家提示  [2019]第4号—函证程序中的重点关注事项
2019-10-16 13:49
http://www.bicpa.org.cn/dtzj/zxgg/B15712049585348.html
19
北京注册会计师协会专业技术委员会专家提示[2019]第3号—关于新租赁准则核心变化及新型服务的讨论
2019-9-10 16:04
http://www.bicpa.org.cn/dtzj/zxgg/B15681026575083.html
20
北京注册会计师协会专业技术委员会专家提示[2019]第2号—利用境外组成部分注册会计师工作的考虑
2019-6-13 16:18
http://www.bicpa.org.cn/dtzj/zxgg/B156041387625117.html
21
北京注册会计师协会专业技术委员会专家提示  [2019]第1号—商业银行和保险公司关联交易内部控制审计中的重点关注事项
2019-4-17 14:57
http://www.bicpa.org.cn/dtzj/zxgg/B155548406168327.html
22
北京注册会计师协会专业技术委员会专家提示[2018]第13号—涉及业绩承诺或有对价的相关关注
2018-12-29 14:53
http://www.bicpa.org.cn/dtzj/zxgg/B154606640644812.html
23
北京注册会计师协会专业技术委员会专家提示[2018]第12号—事业单位国有资产产权登记业务重点关注及应对
2018-12-29 14:50
http://www.bicpa.org.cn/dtzj/zxgg/B154606616336711.html
24
北京注册会计师协会专业技术委员会专家提示[2018]第11号—集团财务报表的审计关注
2018-12-27 13:42
http://www.bicpa.org.cn/dtzj/zxgg/B15458892493731.html
25
北京注册会计师协会专业技术委员会专家提示  [2018]第10号----境外并购前财税尽职调查
2018-11-30 13:26
http://www.bicpa.org.cn/dtzj/zxgg/B15435553852066.html
26
北京注册会计师协会专业技术委员会专家提示[2018]第9号—确定和沟通关键审计事项需关注的问题
2018-11-1 16:32
http://www.bicpa.org.cn/dtzj/zxgg/B15410611079433.html
27
北京注册会计师协会专业技术委员会专家提示[2018]第8号—上市前财务尽职调查非鉴证服务的风险关注
2018-10-15 13:34
http://www.bicpa.org.cn/dtzj/zxgg/B15395816672092.html
28
北京注册会计师协会专业技术委员会专家提示[2018]第7号—商誉减值审计中的重点关注事项
2018-9-27 16:49
http://www.bicpa.org.cn/dtzj/zxgg/B15380381748413.html
29
北京注册会计师协会专业技术委员会专家提示[2018]第6号—香港资本市场备考财务信息相关规则
2018-9-18 14:19
http://www.bicpa.org.cn/dtzj/zxgg/B15372513662406.html
30
北京注册会计师协会专业技术委员会专家提示[2018]第5号—运用合并对价分摊评估结果的风险考虑
2018-9-10 09:35
http://www.bicpa.org.cn/dtzj/zxgg/B15365424529651.html
31
北京注册会计师协会专业技术委员会专家提示[2018]第4号-公用经费的审计要点
2018-8-30 11:24
http://www.bicpa.org.cn/dtzj/zxgg/B15355994216707.html
32
北京注册会计师协会专业技术委员会专家提示[2018]第3号—内地A股和香港主板IPO中注册会计师工作范围的比较
2018-8-21 11:18
http://www.bicpa.org.cn/dtzj/zxgg/B15348167116787.html
33
北京注册会计师协会专业技术委员会专家提示[2018]第2号-司法会计鉴定业务承接与实施的基本要求
2018-7-5 14:45
http://www.bicpa.org.cn/dtzj/zxgg/B153077309749111.html
34
北京注册会计师协会专业技术委员会专家提示[2018]第1号—审计中对结构化主体的关注
2018-6-29 13:40
http://www.bicpa.org.cn/dtzj/zxgg/B15302503444382.html
35
北京注册会计师协会专家委员会专家提示[2017]第10号—新收入准则下可变对价确认条件的考量
2018-1-2 10:29
http://www.bicpa.org.cn/dtzj/zxgg/B151485980812441.html
36
北京注册会计师协会专家委员会专家提示[2017]第9号—新收入准则下收入确认时点的税会差异
2017-12-21 09:52
http://www.bicpa.org.cn/dtzj/zxgg/B151382102118913.html
37
北京注册会计师协会专家委员会专家提示[2017]第8号—经济责任审计中固定资产处置问题
2017-12-21 09:43
http://www.bicpa.org.cn/dtzj/zxgg/B151382057838412.html
38
北京注册会计师协会专家委员会专家提示[2017]第7号—司法会计鉴定业务证据的分析
2017-12-14 09:26
http://www.bicpa.org.cn/dtzj/zxgg/B151321473710241.html
39
北京注册会计师协会专家委员会专家提示 [2017]第6号—市级科技经费专项审计要点
2017-12-14 09:23
http://www.bicpa.org.cn/dtzj/zxgg/B151321422189940.html
40
北京注册会计师协会专家委员会专家提示[2017]第5号—经济责任审计中对“小金库”的关注
2017-11-30 11:49
http://www.bicpa.org.cn/dtzj/zxgg/B151201376561112.html
41
北京注册会计师协会专家委员会专家提示[2017]第4号—房地产企业对债权和股权的确认
2017-11-2 14:30
http://www.bicpa.org.cn/dtzj/zxgg/B1509604139649853.html
42
北京注册会计师协会专家委员会专家提示[2017]第3号—民办教育培训机构IPO审计关注重点
2017-10-26 16:13
http://www.bicpa.org.cn/dtzj/zxgg/B1509004159013842.html
43
北京注册会计师协会专家委员会专家提示[2017]第2号—房地产企业二级住宅和商业开发的收入确认
2017-3-14 09:53
http://www.bicpa.org.cn/dtzj/zxgg/B1489456227128279.html
44
北京注册会计师协会专家委员会专家提示[2017]第1号——2016年度财务报表审计对“营改增”的特殊考虑
2017-2-16 10:19
http://www.bicpa.org.cn/dtzj/zxgg/B1487211507564243.html
45
北京注册会计师协会专家委员会专家提示[2016]第13号—重大风险领域函证程序的实施
2016-12-26 15:28
http://www.bicpa.org.cn/dtzj/zxgg/B1482736367477118.html
46
北京注册会计师协会专家委员会专家提示[2016]第11号—房地产企业持续经营风险识别与审计应对
2016-11-30 14:05
http://www.bicpa.org.cn/dtzj/zxgg/B1480485924321720.html
47
北京注册会计师协会专家委员会专家提示[2016]第10号—关于社会组织审计的几点关注
2016-11-30 10:19
http://www.bicpa.org.cn/dtzj/zxgg/B1480472338114714.html
48
北京注册会计师协会专家委员会专家提示[2016]第9号--IPO企业会计政策和会计估计变更的审计关注
2016-11-16 14:30
http://www.bicpa.org.cn/dtzj/zxgg/B1479277789203624.html
49
北京注册会计师协会专家委员会专家提示[2016]第7号—对IPO审计调账的考虑
2016-11-2 09:28
http://www.bicpa.org.cn/dtzj/zxgg/B1478049860757539.html
50
北京注册会计师协会专家委员会专家提示[2016]第6号——收入准则与建造合同准则下的完工百分比法
2016-9-20 13:49
http://www.bicpa.org.cn/dtzj/zxgg/B1474349871020313.html
51
北京注册会计师协会专家委员会专家提示[2016]第5号—《慈善法》要点点读
2016-8-22 16:21
http://www.bicpa.org.cn/dtzj/zxgg/B1471854003452163.html
52
北京注册会计师协会专家委员会专家提示[2016]第4号—关于《司法鉴定程序通则》的几点关注
2016-8-12 10:28
http://www.bicpa.org.cn/dtzj/zxgg/B1470968269904111.html
53
北京注册会计师协会专家委员会专家提示[2016]第3号—同一控制下控股合并的审计关注
2016-8-11 10:41
http://www.bicpa.org.cn/dtzj/zxgg/B1470882433276102.html
54
北京注册会计师协会专家委员会专家提示[2016]第2号——关于P2P信贷服务及第三方支付企业收入确认的一般考虑
2016-5-26 09:46
http://www.bicpa.org.cn/dtzj/zxgg/B1464226082976475.html
55
北京注册会计师协会专家委员会专家提示[2016]第1号—关于网络游戏企业收入审计技巧和方法
2016-3-4 15:18
http://www.bicpa.org.cn/dtzj/zxgg/B145706953606019.html
56
北京注册会计师协会专家委员会专家提示[2015]第12号—关于互联网企业审计的一般考虑
2015-12-10 15:13
http://www.bicpa.org.cn/dtzj/zxgg/B1449731538841268.html
57
北京注册会计师协会专家委员会专家提示[2015]第11号——关于对社会组织进行年度审计的特殊考虑
2015-12-9 15:23
http://www.bicpa.org.cn/dtzj/zxgg/B1449645539044248.html
58
北京注册会计师协会专家委员会专家提示[2015]第9号—经济责任审计中的固定资产投资
2015-12-7 13:13
http://www.bicpa.org.cn/dtzj/zxgg/B1449465022072234.html
59
北京注册会计师协会专家委员会专家提示[2015]第10号—国有企业经济责任审计中的审计评价
2015-12-8 09:51
http://www.bicpa.org.cn/dtzj/zxgg/B1449465172880235.html
60
北京注册会计师协会专家委员会专家提示[2015]第8号——高新技术企业认定之收入审计
2015-12-1 14:23
http://www.bicpa.org.cn/dtzj/zxgg/B1448950919848199.html
61
北京注册会计师协会专家委员会专家提示[2015]第7号——房地产企业土地增值税、企业所得税审计
2015-11-30 15:26
http://www.bicpa.org.cn/dtzj/zxgg/B1448868170066194.html
62
北京注册会计师协会专家委员会专家提示[2015]第6号—房地产企业存货跌价的审计
2015-11-23 09:29
http://www.bicpa.org.cn/dtzj/zxgg/B1448241929151135.html
63
北京注册会计师协会专家委员会专家提示[2015]第5号—关于房地产行业存货的审计
2015-11-16 13:56
http://www.bicpa.org.cn/dtzj/zxgg/B144765333828073.html
64
北京注册会计师协会专家委员会专家提示[2015]第4号—关于出庭质证
2015-11-3 15:44
http://www.bicpa.org.cn/dtzj/zxgg/22c9cb7f-abcb-4e25-b0f4-95696f50e08a.html
65
北京注册会计师协会专家委员会专家提示[2015]第3号—访谈在经济责任审计的应用
2015-10-19 10:12
http://www.bicpa.org.cn/dtzj/zxgg/B1445219005024855.html
66
北京注册会计师协会专家委员会专家提示[2015]第2号—对坏账准备的相关考虑
2015-10-8 14:22
http://www.bicpa.org.cn/dtzj/zxgg/B1444285193662775.html
67
北京注册会计师协会专家委员会专家提示[2015]第1号—对连锁超市类企业租金摊销的考虑
2015-9-9 15:32
http://www.bicpa.org.cn/dtzj/zxgg/B1441782982318629.html
68
北京注册会计师协会专家委员会专家提示〔2014〕第9号—关于财务报表列报中的其他综合收益
2015-1-15 09:34
http://www.bicpa.org.cn/dtzj/zxgg/B1421285002619938.html
69
北京注册会计师协会专家委员会专家提示〔2014〕第10号—关于职工薪酬
2015-1-15 09:28
http://www.bicpa.org.cn/dtzj/zxgg/B1421285234415939.html
70
北京注册会计师协会专家委员会专家提示〔2014〕第8号—钢材贸易类企业主要业务审计风险提示
2014-12-31 09:56
http://www.bicpa.org.cn/dtzj/zxgg/B1419989462429844.html
71
北京注册会计师协会专家委员会专家提示〔2014〕第7号-零售及消费品行业收入审计的考虑
2014-12-31 09:20
http://www.bicpa.org.cn/dtzj/hydt/c7ec7531-7f6c-4d70-8f90-fb457ce91aab.html
72
北京资产评估协会转发中评协关于就《资产评估操作专家提示——抵(质)押品评估(征求意见稿)》等四项专家提示公开征求意见的通知
2014-12-8 09:57
http://www.bicpa.org.cn/dtzj/zxgg/B1416897606720593.html
73
北京资产评估协会转发中评协关于就《资产评估操作专家提示——金融企业首次公开发行上市资产评估方法选用(征求意见稿)》等五项专家提示公开征求意见的通知
2014-12-8 09:57
http://www.bicpa.org.cn/dtzj/zxgg/B1416895460252591.html
74
北京注册会计师协会专家委员会专家提示〔2014〕第6号-IPO企业实地核查的运用
2014-12-1 16:09
http://www.bicpa.org.cn/dtzj/zxgg/B1417421160332630.html
75
北京注册会计师协会专家委员会专家提示[2014]第5号——IPO审计中关于BOT业务的考虑
2014-11-26 15:45
http://www.bicpa.org.cn/dtzj/zxgg/B1416985212146612.html
76
北京注册会计师协会专家委员会专家提示[2014]第4号—高新技术企业认定研究开发费用审计
2014-10-10 14:27
http://www.bicpa.org.cn/dtzj/zxgg/B1412922373159263.html
77
北京注册会计师协会专家委员会专家提示[2014]第3号—IPO企业研发费用资本化
2014-8-19 10:14
http://www.bicpa.org.cn/dtzj/zxgg/B1408083574781431.html
78
北京资产评估协会中小评估机构技术援助专家委员会专家提示第4号——无形资产评估
2014-4-23 15:38
http://www.bicpa.org.cn/dtzj/zxgg/B1397715328981309.html
79
北京资产评估协会中小评估机构技术援助专家委员会专家提示第3号——发电企业相关评估项目
2014-4-16 09:30
http://www.bicpa.org.cn/dtzj/zxgg/B1397611823216297.html
80
北京资产评估协会中小评估机构技术援助专家委员会专家提示第2号——折现率选取
2014-4-14 10:01
http://www.bicpa.org.cn/dtzj/zxgg/B1397440887995285.html
81
北京注册会计师协会专家委员会专家提示[2014]第2号—关于IPO企业关联方关系及其交易的审计
2014-1-21 12:54
http://www.bicpa.org.cn/dtzj/zxgg/B1390270614469986.html
82
北京注册会计师协会专家委员会专家提示[2014]第1号—生物资产监盘中对专家工作的利用
2014-1-21 10:24
http://www.bicpa.org.cn/dtzj/zxgg/B1390269830247985.html
83
北京注册会计师协会专家委员会专家提示第10号——关于IPO企业合并财务报表合并范围
2013-12-6 15:13
http://www.bicpa.org.cn/dtzj/zxgg/B1386314007174667.html
84
北京注册会计师协会专家委员会专家提示第9号——关于政府补助事项的审计
2013-11-27 10:26
http://www.bicpa.org.cn/dtzj/zxgg/B1385519190857568.html
85
北京注册会计师协会专家委员会专家提示第8号——生态养殖淡水产品审计盘点解析
2013-11-11 14:28
http://www.bicpa.org.cn/dtzj/zxgg/B1384151150230417.html
86
北京注册会计师协会专家委员会专家提示第7号——IPO企业商誉的审计
2013-10-15 08:56
http://www.bicpa.org.cn/dtzj/zxgg/B1381798553034179.html
87
北京注册会计师协会专家委员会专家提示第6号——递延所得税资产的确认和计量
2013-10-15 08:56
http://www.bicpa.org.cn/dtzj/zxgg/B1381798460158178.html
88
北京资产评估协会转发中国资产评估协会关于对《资产评估操作专家提示——收益法中的敏感性分析(征求意见稿)》和《资产评估操作专家提示——采掘业企业评估(征求意见稿)》征求意见的通知
2013-10-17 10:04
http://www.bicpa.org.cn/dtzj/zxgg/B1381392680065144.html
89
北京资产评估协会中小评估机构技术援助专家委员会专家提示第1号——法院委托评估项目
2013-10-8 16:06
http://www.bicpa.org.cn/dtzj/zxgg/B1381219530320122.html
90
北京注协专家委员会专家提示第5号——IPO企业职工薪酬的审计
2013-8-30 12:47
http://www.bicpa.org.cn/dtzj/zxgg/B1375683356372109.html
91
北京注册会计师协会专家委员会专家提示第4号——信息网络侵权司法会计审计解析
2013-4-19 13:27
http://www.bicpa.org.cn/dtzj/zxgg/B1366349216651656.html
92
北京注册会计师协会专家委员会专家提示第3号——基金会审计实务中应关注的问题
2013-4-8 11:10
http://www.bicpa.org.cn/dtzj/zxgg/B1365389483711567.html
93
北京注册会计师协会转发中国资产评估协会三项资产评估准则及两项专家提示的通知
2013-3-29 09:20
http://www.bicpa.org.cn/dtzj/zxgg/B1364520026240510.html
94
北京注册会计师协会专家委员会专家提示第2号     ——关于执行企业会计准则企业2012年年报事项的提示
2013-3-13 08:59
http://www.bicpa.org.cn/dtzj/zxgg/B1363136349507417.html
95
北京注册会计师协会专家委员会专家提示第1号——IPO项目专项核查新规的应对
2013-3-13 08:59
http://www.bicpa.org.cn/dtzj/zxgg/B1363136218650416.html
96
北京注册会计师协会关于发布专家委员会专家提示的通知
2013-3-12 15:24
http://www.bicpa.org.cn/dtzj/zxgg/B1363071786483411.html

评分

1

查看全部评分

发表于 2021-6-7 07:26:45 | 显示全部楼层
没有计算机软件基础能自学上吗?
 楼主| 发表于 2021-6-9 21:59:55 | 显示全部楼层
xuxcpa 发表于 2021-6-7 07:26
没有计算机软件基础能自学上吗?

应该可以,很多功能python中已经用模块形式组装好了,我们只要把它们拼接起来就行。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|中国会计视野论坛 ( 沪ICP备05013522号-2 )

GMT+8, 2021-6-19 10:37

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表