您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 第1章--Python零基础语法入门
第1章PYTHON零基础语法入门1.1Python与PyCharm安装1.2变量和字符串1.3函数与控制语句1.4Python数据结构1.5Python文件操作1.6Python面向对象1.1PYTHON与PYCHARM安装1.1.1Python安装(Windows、Mac和Linux)1.1.2PyCharm安装1.1.1PYTHON安装(WINDOWS、MAC和LINUX)1.Windows上安装Python3(1)打开浏览器,访问Python官网()。(2)鼠标移动至Downloads链接,点击Windows链接。(3)根据读者的Windows版本(32位或64位),下载相应的Python3.5版本,如为Windows32位,点击下载Windowsx86executableinstaller,如果为Windows64位,点击下载Windowsx86-64executableinstaller。(4)单击运行文件,勾选AddPython3.5toPATH,然后单击InstallNow按钮即可完成安装。在电脑中,通过打开命令提示符(cmd),输入python,出现如图界面,就说明Python环境安装成功。界面出现提示符就表明进入了Python交互式环境,输入代码按Enter键即可运行Python代码,通过输入exit()并按Enter键,就可以退出Python交互式环境。2.Mac上安装Python3Mac中自带了Python2.7,需在Python官网上安装Python3.5。Mac中的安装比Windows下更为简单,一直单击“下一步”按钮即可完成。打开终端,输入python3,即可进入Mac的Python3的交互式环境。3.Linux上安装Python3大部分Linux系统电脑内置Python2和Python3,通过在终端输入python–version,可以查看当前Python3的版本。如果需要安装某个特定版本的Python,可以在终端中输入:sudoapt-getinstallpython3.51.1.2PYCHARM安装安装好Python环境后,读者还需安装一个集成开发环境(IDE),IDE集成了代码编写功能、分析功能、编译功能、调试功能。在这里推荐最智能好用的PythonIDE,叫做PyCharm。进入PyCharm的官网(),下载社区版即可。如何使用PyCharm关联Python解释器,让PyCharm可以运行Python代码。(1)打开PyCharm,在菜单栏中选择:FileDefalutSettings。(2)单击ProjectInterpreter,在窗口右方选择Python环境,选择Python3.5,单击OK按钮,即可关联Python解释器(如下图所示)。关联Python解释器1.2变量和字符串1.2.1变量1.2.2字符串的“加法”和“乘法”1.2.3字符串的切片和索引1.2.4字符串方法1.2.1变量Python中的变量很好理解,例如:a=1这种操作称为赋值,意思为将数值1赋给了变量a。注意:Python中语句结束不需要已分号结束,变量不需要提前定义。现在有变量a和变量b,我们可以通过下面代码进行变量a、b值的对换:a=4b=5t=a#把a值赋给t变量a=b#把b值赋给a变量b=t#把t值赋给b变量print(a,b)#result54这种方法类似于将两个杯子中的饮料对换,我们只需多加一个杯子,即可完成饮料的对换工作。1.2.2字符串的“加法”和“乘法”由于Python爬虫的对象大部分为文本,所以字符串的用法尤为重要。在Python中,字符串由双引号或单引号和引号中的字符组成。首先,通过下面代码看看字符串的“加法”:a='I'b='love'c='Python'print(a+b+c)#字符串相加#resultIlovePython在爬虫代码中,会经常构造URL,例如:在爬取一个网页链接时,只有一部分:/u/9104ebf5e177,这部分链接是无法访问的,还需要,这时可以通过字符串的“加法”进行合并。Python的字符串不仅可以相加,也可以乘以一个数字:a='word'print(a*3)#字符串乘法#resultwordwordword字符串乘以一个数字,意思就是将字符串复制这个数字的份数。1.2.3字符串的切片和索引字符串的切片和索引就是通过string[x],获取字符串的一部分信息:a='Ilovepython'print(a[0])#取字符串第一个元素#resultIprint(a[0:5])#取字符串第一个到第五个元素#resultIlovprint(a[-1])#取字符串最后一个元素#resultn通过下图就能清楚的理解字符串的切片和索引:1.2.4字符串方法Python做为面向对象的语言,每个对象都有着相应的方法,字符串也是一样,拥有着多种方法,在这里介绍爬虫中所常用的几种方法。1.split()方法a='(a.split('.'))#result[']2.repalce()方法a='Thereisapples'b=a.replace('is','are')print(b)#resultThereareapples这种方法类似文本中的“查找和替换”功能。3.strip()方法a='pythoniscool'print(a.strip())#resultpythoniscoolstrip()方法返回去除两侧(不包括内部)空格的字符串,也可以指定需要去除的字符,将他们列为参数中即可。4.format()方法最后,再讲解下好用的字符串格式化符,首先看下代码。a='{}ismylove'.format('Python')print(a)#resultPythonismylove字符串格式化符就像是做选择题,留了空给做题者选择。在爬虫过程中,有些网页链接的部分参数是可变的,这时使用字符串格式化符可以减少代码的使用量。字符串格式化符演示1.3函数与控制语句1.3.1函数1.3.2判断语句1.3.3循环语句1.3.1函数“脏活累活交给函数来做”,首先,看看Python中定义函数的方法。def函数名(参数1,参数2...):return'结果'制作一个输入直角边就能计算出直角三角形的面积函数:deffunction(a,b):return'1/2*a*b'#也可以写出这样deffunction(a,b):print(1/2*a*b)注意:别太纠结区别,用return是返回一个值,而第二个是调用函数执行打印功能。通过输入function(2,3),便可以调用函数,计算直角边为2和3的直角三角形的面积。1.3.2判断语句在爬虫实战中,也会经常使用判断语句,Python的判断语句格式如下:ifcondition:doelse:do#注意:冒号和缩进不要忘记了#再看一下多重条件的格式ifcondition:doelifcondition:doelse:do在平时使用密码时,输入密码正确即可登录,错误时就需要继续输入了。defcount_login():password=input('password:')ifpassword=='12345':print('输入成功!')else:print('错误,再输入')count_login()count_login()(1)运行程序,输入密码按Enter键。(2)如果输入的字符串为12345,则打印“输入成功!”,程序结束。(3)如果输入的字符串不为12345,则打印“错误,再输入”,继续运行程序,直到输入正确为至。读者也可以设计的更为有趣,例如:“3次输入失败后,退出程序”等。1.3.3循环语句Python的循环语句包括for循环和while循环,如下代码所示。#for循环foriteminiterable:do#item表示元素,iterable是集合foriinrange(1,11):print(i)#其结果为依次输出1到10,切记11是不输出的,range为Python内置函数。#while循环whilecondition:do1.4PYTHON数据结构1.4.1列表1.4.2字典1.4.3元组和集合1.4.1列表在爬虫实战中,用的最多的就是列表数据结构,不论是构造出的多个URL,还是爬取到的数据,大多数为列表数据结构。首先,介绍列表的最显著的特征:(1)列表中的每一个元素都是可变的。(2)列表的元素都是有序的,也就是说每个元素都有对应的位置(类似字符串的切片索引)。(3)列表可以容纳所有的对象。1.4.2字典Python的字典数据结构与现实中的字典类似,以键值对(’key’-‘value’)的形式表现出来。本文中只讲解字典的创造,字典的操作在后文中进行详细介绍。user_info={'name':'xiaoming','age':'23','sex':'man'}1.4.3元组和集合在爬虫中,元组和集合很少用到,这里就只做简单的介绍。元组类似与列表,但是元组的元素不能够修改,只能查看,元组的格式如下。tuple=(1,2,3)集合的概念类似与数学中的集合。每个集合中的元素是无序的,不可重复的对象,有时,可以通过集合把重复的数据去除掉。list=['xiaoming','zhangyun','xiaoming']set=set(list)print(set)#result{'zhangyun','xiaoming'}1.5PYTHON文件操作1.5.1打开文件1.5.2读写文件1.5.3关闭文件1.5.1打开文件Python中通过open()函数打开文件,语法如下:open(name[,mode[,buffering]])open()函数使用文件名做为唯一的强制参数,然后返回一个文件对象。模式(mode)和缓冲(buffering)是可选参数。在Python的文件操作中,mode参数的输入是有必要的,而buffering使用较少。1.5.2读写文件上小节中有了名为f的类文件对象,那么就可以通过f.write()方法和f.read()方法写入和读取数据。f=open('C:/Users/Administrator/Desktop/file.txt','w+')f.write('helloworld')这时,在本机上打开file.txt文件,可以看到下图所示的结果。如果再次运行程序,txt文件中的内容不会继续添加,可以修改模式参数为’r+’,便可一直写入文件。1.5.3关闭文件当完成读写工作后,应该牢记使用close()方法关闭文件。这样可以保证Python进行缓冲的清理(出于效率的考虑而把数据临时存储在内存中)和文件的安全。通过下面代码即可关闭文件。f=open('C:/Users/Administrator/Desktop/file.txt','r')content=f.read()print(content)f.close()1.6PYTHON面向对象1.6.1定义类1.6.2实例属性1.6.3实例方法1.6.4类的继承1.6.1定义类类是用来描述具有相同的属性和方法的对象的集合。人可以通过不同的肤色划分不同的种类、食物也有不同的种类、商品也是形形色色,但划分为同一类的物体,他们肯定具有相似的特征和行为方式。对于同一款自行车而言,他们的组成结构都是一样的:车架、车轮、脚踏等。通过Python可以定义这个自行车的类:classBike:compose=['frame','wheel','pedal']通过使用class定义一个自行车的类,类中的变量compose称为类的变量,专业术语为类的属性。这样,顾客购买的自行车,组成结构都是一模一样的了。my_bike=Bike()you_bike=Bike(
本文标题:第1章--Python零基础语法入门
链接地址:https://www.777doc.com/doc-1744210 .html