北京盛世元鸿职业技能教培中心
 
.Shengshi Yuanhong vocational skills teaching and training center.

最新动态★

关于开展《全国AI与Python爬虫实战技术与应用》-培训 2022-1

 二维码 21
发表时间:2021-12-13 12:23作者:会务处来源:北京盛世元鸿职业技能教培中心网址:http://www.ssyh.python.com

各企事业单位、高等院校及科研院所:

Python 是一种面向对象的,动态的程序设计语言,具有非常简洁而清晰的语法,既可以用于快速开发程序,也可以用于开发大规模软件,特别适合完成高层任务。随着 NumPy、SciPy 等众多程序库的开发。 Python这门编程语言包罗万象,可以说掌握了python,除了一些特殊环境和高度的性能要求,Python 越来越适合于做科学计算。网络爬虫(又被称为网页蜘蛛,网络机器人,在 FOAF 社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。

为提升相关科技工作者的技术水平,特举办2022“Python爬虫技术与应用”线上直播结培训班,本次培训从爬虫的基本知识入手,使用Python作为实现工具,一步步讲述网络爬虫及文本分析的实现,具体内容如下:

一、会议优势:

1.会议全程录播,一机一码,可后期回看

2.内容不定期更新,后期免费参加

3.配备 PPT、电子版教材

4.免费提供后期技术指导

5.建立微信群方便交流


二.时间: 2022年1月8日 - 2022年1月10日   线上会议:腾讯会议直播


三.参会目标

1、学完能够从零开始掌握Python爬虫项目的编写,学会独立开发常见的爬虫项目;

2、学完能掌握常见的反爬处理手段,比如浏览器伪装、代理IP池技术和用户代理池技术等;

3、学完能够熟练使用JSON,正则表达式和XPath表达式进行信息提取;

4、学完掌握抓包技术,掌握屏蔽的数据信息如何进行提取,学会自动模拟加载行为、进行网址构造和自动模拟Ajax异步请求数据;

5、熟练掌握Requests模块和Selenium模块,使用Requests模块和Selenium模块进行爬虫项目开发

四、主讲专家

AI创业公司合伙人,技术总监。机器学习,深度学习领域多年一线开发研究经验,精通算法原理与编程实践。曾使用Tensorflow,Caffe,Keras 等深度学习框架完成过多项图像,语音,nlp, 搜索相关的人工智能实际项目,研发经验丰富。拥有两项国家专利。同时具有多年授课经验,讲课通熟易懂,代码风格简洁清晰。长期从事深度学习、人工智能、机器学习、计算机视觉等领域的教学与研究工作。

五、参会对象

全国高等院校人工智能、数据科学相关学科;计算机、网络通信、自动化、电子工程、 数理统计、电子商务、物联网工程、物流管理、信息与计算科学等专业的科研、教学带头人,骨干教师、博士生、 硕士生;从事人工智能,计算机、数据科学、互联网等相关领域的科研院所的项目负责人、科研人员、工程技术人员。各地方政府信息中心负责人、 技术骨干。互联网产业投资团队——人工智能,数据科学方向。以及应用开发商, 服务提供商等。有志于数据分析,机器学习研究和应用的从业者


时间

大章节

小章节

第一天

一、爬虫基础介绍

1.爬虫的法律风险

2.爬虫的应用

3.爬虫的定义

4.爬虫的分类

5.ROBOTS协议介绍

二、python基础学习

1.print使用

2.运算符和变量

3.循环

4.列表元组字典

5.if条件

6.函数

7.模块

8.类的使用

9.input用法

10.文件读写

11.异常处理

案例:猜数字游戏设计

三、.科学计算包numpy使用学习

1.numpy的属性

2.创建array

3.numpy的运算

4:随机数生成以及矩阵的运算

5.numpy的索引

6.array合并

7.array分割

8.numpy的浅拷贝和深拷贝

四、数据分析库pandas使用学习

1.Series,DataFrame

2.选择数据

3.赋值及操作

3.处理丢失数据

4.读取及写入文件

5.合并

五、绘图工具包matplotlib学习

1.基础用法

2.figure图像

3.设置坐标轴

4.legend图例

5.scatter散点图

6.contours等高线图

7.subplot

六、课堂练习-python应用

使用python设计一个猜数字小游戏

七、HTTP协议

1.HTTP和HTTPS

2.HTTP的请求过程

3.HTTP的请求形式

4.HTTP的常见请求头

5.GET和POST

6响应状态码

第二天

七、Requests模块使用

1.Requests模块介绍

2.发送简单请求

3.使用Requests下载数据

4.发送带Header的请求

5.发送带参数的请求

6.发送POST请求

八、天气查询项目

1.使用爬虫进行全国天气预测查询

2.获取未来7天温度,风力,是否下雨等信息

九、百度贴吧爬虫项目

1.百度贴吧页面爬取策略分析

2.使用requests模块爬取指定贴吧内容

3.把爬取到的内容保存到电脑本地

十、课堂练习-豆瓣top250电影爬取

爬虫豆瓣top250页面信息并保存到电脑本地

十一、百度翻译爬虫项目

1.百度翻译结果获取分析

2.使用requests模块完成简单翻译

3.js代码调试解析

4.使用python模拟js代码运行结果

5.使用requests模块获取翻译结果

6..自动识别要翻译的语言

7..把中文翻译成英文或把英文翻译成中文

十二、代理介绍

1.透明代理,普通代理,高级匿名代理介绍

2.代理的使用介绍

十三、cookie和session介绍

1. cookie和session区别

2. 爬虫处理cookie和session

3. 使用requests的session登陆网站

十四、requests小技巧

1. cookie转字典,字典转cookie

2. url编解码

3. ssl证书错误

4. 请求超时处理

第三天

十五、JSON数据介绍

1.JSON数据格式

2.Xml数据格式

3.JSON数据保存和载入

十六、豆瓣美剧爬虫项目

1.豆瓣美剧数据爬取分析

2.使用requests模块爬取所有美剧数据

3.解析JSON数据进行到电脑本地

十七、xpath数据解析

1. xpath介绍

2. xpath的工具安装

3. xpath的基础使用

十八、课堂练习-电影详情解析

1.页面xpath分析

2.使用xpath遍历每一个电影

3.使用xpath解析豆瓣电影中的电影名称,导演演员,评分,图片等信息并保存

十九、正则表达式介绍

4. 什么是正则表达式

5. 正则表达式常用字符介绍

6. Match的用法

7. Search的用法

8. Findall的用法

9. Sub的用法

10. Compile的用法

二十、百度图片爬取项目

1.百度图片页面分析

2.爬取任意关键词任意张图片并保存

二十一、selenium工具介绍

1. 什么是selenium

2. Chromedriver介绍

3. 使用selenium模拟浏览器行为

二十二、36kr文章爬取项目

1.36kr页面分析

2.使用selenium模拟36kr文章查询

3.获取所有查询到的文章信息

4.获取所有文章详情并保存



六、参会费用

统一收费:3900 /培训费、证书认证费、资料费、指导费、发票费等)费用提供用于报销的正规机打发票及盖有公章的纸质通知文件;如需开具培训费的单位请联系会务人员要培训通知;

七、专项优惠政策(两项费用优惠不可同时享用)

1)1231日之前报名缴费,每人优惠 100 元

2)3 人以上报名每人可优惠 200 元

3)5 人及以上团报可赠送一个免费名额

一次报名参加会议,后期本人可无限次数参加相同会议,学会为止。


八、颁发证书

中国管理科学研究院颁发人工智能应用工程管理师培训证书。注:也可颁发Python爬虫工程师证书-需备注 该证书可作为有关单位专业技术人员能力评价、以及求职应聘和从业人员加薪、晋升、考核等任职的重要依据。申报资料:请准备两寸蓝底照片、身份证及学历证明(学生证、毕业证、学位证都可)电子版即可。

九、报名方式

          手机(同微信):18311050656        话:010-53350015     邮箱:1549935216@qq.com



1628405668.jpg





                 企业箱 :liuhaonan@bjcsyhkjwwgc.onexmail.com
E-mail: 1549935216@qq.com(报名中心)           电话:010-53350015

ANSYS/FLUENT培训;CFD专项培训;人工智能/Python培训;知识图谱/深度学习培训;Lammps分子动力学培训;Matlab大数据培训;SPSS培训;ABAQUS有限元培训;  simulink培训;workbench培训等,面向用户实际需求,提供顾问式咨询培训                                   

  微 信 咨 询