中谷教育Python视频(课件、源码)推荐

发布时间 - 2017-12-04 00:00:00    点击率:

《中谷教育python视频教程》讲的是python开发的入门教程,它将介绍python语言的特点和适用范围,python基本的数据类型,条件判断和循环,函数,以及python特有的切片和列表生成式。希望本python教程能够让您快速入门并编写简单的python程序。

课程播放地址:http://www./course/501.html

该老师讲课风格:

教师讲课生动形象,机智诙谐,妙语连珠,动人心弦。一个生动形象的比喻,犹如画龙点睛,给学生开启智慧之门;一种恰如其分的幽默,引来学生会心的微笑,如饮一杯甘醇的美酒,给人以回味和留恋;哲人的警句、文化的箴言不时穿插于讲述中间,给人以思考和警醒。

本视频中较为难点是爬虫了:

1、单个网页的简易爬虫

以下爬虫的主要功能是爬取百度贴吧中某一页面的所有图片。代码由主要有两个函数:其中getHtml()通过页面url获取其对应的html内容,getImage()则通过解析html获取图片地址,实现图片的下载。

代码如下:

import urllib  
import re  
   
def getHtml(url):  
    """通过页面url获取其对应的html内容 
    """  
    page = urllib.urlopen(url) #打开页面  
    content = page.read() #读取页面内容  
    return content  
     
def getImage(html):  
    """通过解析html获取图片地址,实现图片的下载 
    """  
    regx =r'src="(.+?\.jpg)" pic_ext' #利用正则表达式获得图片url  
    imgreg = re.compile(regx)  
    imglist = re.findall(imgreg,html)  
    x = 0  
    for imgurl in imglist:  
        filepath ='F:\\Downloads\\'+str(x)+'.jpg'  
        urllib.urlretrieve(imgurl,filepath) #将图片下载到本地  
        x += 1  
    print 'completed!'  
     
html = getHtml('http://tieba.baidu.com/p/2505265675')  
imglist = getImage(html)

2、爬取多网页的框架

这里只讲基本思想:第一步是选择一个起始页面,可以直接选择某个网站的主页作为起始页面;第二步是分析这个起始页面的所有链接,然后爬取所有链接的内容;第三步就是无休无止的递归过程,分析爬虫所及的所有子页面内部链接,如果没有爬取过,则继续无休无止的爬取。

借用知乎上谢科兄弟的一段代码来说明。设定初始页面initial_page,爬虫就从这里开始获取页面,url_queue用来存将要爬取的页面队列,seen用来存爬取过的页面。

import Queue  
initial_page ="http://www.renminribao.com"  
url_queue =Queue.Queue()  
seen = set()  
seen.insert(initial_page)  
url_queue.put(initial_page)  
while True:  
    if url_queue.size()>0:  
        current_url = url_queue.get()    #取出队例中第一个的url  
        store(current_url)             #把这个url代表的网页存储好  
        for next_url inextract_urls(current_url): #提取把这个url里链向的url  
            if next_url not in seen:  
                seen.put(next_url)  
                url_queue.put(next_url)  
    else:  
        break

这里还给大家推荐了源码资源的下载:http://www./xiazai/learn/1944

这个给大家分享了视频的课件


# python  # 无休无止  # 递归  # 给人以  # 取过  # 动人心弦  # 妙语连珠  # 第一个  # 甘醇  # 画龙点睛  # 恰如其分 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 消息称 OpenAI 正研发的神秘硬件设备或为智能笔,富士康代工  宙斯浏览器视频悬浮窗怎么开启 边看视频边操作其他应用教程  Laravel的Blade指令怎么自定义_创建你自己的Laravel Blade Directives  ChatGPT回答中断怎么办 引导AI继续输出完整内容的方法  Android okhttputils现在进度显示实例代码  Bootstrap整体框架之JavaScript插件架构  如何快速打造个性化非模板自助建站?  如何做网站制作流程,*游戏网站怎么搭建?  ,南京靠谱的征婚网站?  Angular 表单中正确绑定输入值以确保提交与验证正常工作  Midjourney怎样加参数调细节_Midjourney参数调整技巧【指南】  教你用AI将一段旋律扩展成一首完整的曲子  Laravel如何使用Blade组件和插槽?(Component代码示例)  WEB开发之注册页面验证码倒计时代码的实现  C#如何调用原生C++ COM对象详解  Microsoft Edge如何解决网页加载问题 Edge浏览器加载问题修复  Laravel怎么创建自己的包(Package)_Laravel扩展包开发入门到发布  Laravel怎么进行数据库回滚_Laravel Migration数据库版本控制与回滚操作  Laravel如何使用集合(Collections)进行数据处理_Laravel Collection常用方法与技巧  laravel怎么配置和使用PHP-FPM来优化性能_laravel PHP-FPM配置与性能优化方法  iOS发送验证码倒计时应用  如何获取上海专业网站定制建站电话?  南京网站制作费用,南京远驱官方网站?  Laravel路由Route怎么设置_Laravel基础路由定义与参数传递规则【详解】  详解vue.js组件化开发实践  JS中对数组元素进行增删改移的方法总结  如何挑选高效建站主机与优质域名?  如何用PHP工具快速搭建高效网站?  Laravel的.env文件有什么用_Laravel环境变量配置与管理详解  Laravel如何创建自定义Artisan命令?(代码示例)  html5如何实现懒加载图片_ intersectionobserver api用法【教程】  MySQL查询结果复制到新表的方法(更新、插入)  零服务器AI建站解决方案:快速部署与云端平台低成本实践  深圳网站制作设计招聘,关于服装设计的流行趋势,哪里的资料比较全面?  Laravel如何使用Scope本地作用域_Laravel模型常用查询逻辑封装技巧【手册】  长沙企业网站制作哪家好,长沙水业集团官方网站?  Laravel怎么实现观察者模式Observer_Laravel模型事件监听与解耦开发【指南】  DeepSeek是免费使用的吗 DeepSeek收费模式与Pro版本功能详解  Laravel Blade组件怎么用_Laravel可复用视图组件的创建与使用  如何在Tomcat中配置并部署网站项目?  VIVO手机上del键无效OnKeyListener不响应的原因及解决方法  php嵌入式断网后怎么恢复_php检测网络重连并恢复硬件控制【操作】  如何快速使用云服务器搭建个人网站?  Claude怎样写约束型提示词_Claude约束提示词写法【教程】  微信小程序 canvas开发实例及注意事项  如何制作新型网站程序文件,新型止水鱼鳞网要拆除吗?  打开php文件提示内存不足_怎么调整php内存限制【解决方案】  利用python获取某年中每个月的第一天和最后一天  Laravel如何使用Facades(门面)及其工作原理_Laravel门面模式与底层机制  java中使用zxing批量生成二维码立牌