您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > Python > [置顶] 大数据处理之道(十分钟学会Python)
[置顶]大数据处理之道(十分钟学会Python)标签:Python入门大数据处理Python文件处理2014-12-1911:152062人阅读评论(8)收藏举报分类:数据挖掘&机器学习(15)algorithm(19)版权声明:本文为博主原创文章,未经博主允许不得转载。(0)目录快速学Python和易犯错误(文本处理)Python文本处理和Java/C比对十分钟学会Python的基本类型快速学会Python(实战)大数据处理之道(十分钟学会Python)一:python简介(1)Python的由来Python(英语发音:/ˈpaɪθən/),是一种面向对象、解释型计算机程序设计语言,由GuidovanRossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C++重写。(2)Python语法简介----类型转化int(x[,base])将x转换为一个整数long(x[,base])将x转换为一个长整数float(x)将x转换到一个浮点数complex(real[,imag])创建一个复数str(x)将对象x转换为字符串repr(x)将对象x转换为表达式字符串eval(str)用来计算在字符串中的有效Python表达式,并返回一个对象tuple(s)将序列s转换为一个元组list(s)将序列s转换为一个列表chr(x)将一个整数转换为一个字符unichr(x)将一个整数转换为Unicode字符ord(x)将一个字符转换为它的整数值hex(x)将一个整数转换为一个十六进制字符串oct(x)将一个整数转换为一个八进制字符串(3)Python语法简介----类型转化s+r序列连接s*n,n*ss的n次拷贝,n为整数s%d字符串格式化(仅字符串)s[i]索引s[i:j]切片xins,xnotins从属关系forxins:迭代len(s)长度min(s)最小元素max(s)最大元素s[i]=x为s[i]重新赋值s[i:j]=r将列表片段重新赋值dels[i]删除列表中一个元素dels[i:j]删除列表中一个片段(4)(3)Python语法简介----类型转化xy右移x&y按位与x|y按位或x^y按位异或(exclusiveor)~x按位翻转x+y加x-y减x*y乘x/y常规除x//y地板除x**y乘方(xy)x%y取模(xmody)-x改变操作数的符号位+x什么也不做~x~x=-(x+1)abs(x)绝对值divmod(x,y)返回(int(x/y),x%y)pow(x,y[,modulo])返回(x**y)x%moduloround(x,[n])四舍五入,n为小数点位数xy小于xy大于x==y等于x!=y不等于(与相同)x=y大于等于x=y小于等于二:python应用(1)文件处理[python]viewplaincopy1.filename=raw_input('Enteryourfilename')#输入要遍历读取的文件路径及文件名2.file=open(filename,'r')3.done=04.whilenotdone:5.aLine=file.readline()6.if(aLine!=''):7.printaLine,8.else:9.done=110.file.close()#关闭文件解释:.readline()和.readlines()之间的差异是后者一次读取整个文件,.readlines()自动将文件内容分析成一个行的列表,该列表可以由Python的for...in...结构进行处理。另一方面,.readline()每次只读取一行,通常比.readlines()慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用.readline()。如果Python文件读到了文件尾,则会返回一个空字符串‘’,而如果是读到一个空行的话,则会返回一个‘\n’Python的readline()方法,每行最后都会加上一个换行字符‘\n’。有时候有的文件最后一行没有以'\n'结尾时,不返回‘\n’。readlines()方法返回的是一个列表,而readline()返回一个字符串。(2)错误处理Python报错TypeError:'str'objectisnotcallable当一般内部函数被用作变量名后可能出现此错误。比如:range=1foriinrange(0,1):………就会报这样的错误这样的错会报在for行,但是时间引起的原因却是在range=1这行,如果两行相距较远,怎很难被发现。所以要特别注意不要用内部已有的变量和函数名作自定义变量名。或者str被预先定义了str=10foriinrange(1,10):printstr(i)(3)综合应用,文件读取,控制台读取,时间转化,编码转换[python]viewplaincopy1.importtime2.fromtimeimportstrftime3.importsys4.reload(sys)5.sys.setdefaultencoding('utf8')6.#-*-coding:cp936-*-7.print(Hello,Python!)8.#!/usr/bin/python9.a=2110.b=1011.c=012.13.c=a+b14.printLine1-Valueofcis,c15.16.c=a-b17.printLine2-Valueofcis,c18.19.c=a*b20.printLine3-Valueofcis,c21.22.c=a/b23.printLine4-Valueofcis,c24.25.c=a%b26.printLine5-Valueofcis,c27.28.a=229.b=330.c=a**b31.printLine6-Valueofcis,c32.33.a=1034.b=535.c=a//b36.printLine7-Valueofcis,c37.#forrepeatits38.list=[2,4,6,8]39.sum=040.fornuminlist:41.sum=sum+num42.print(Thesumis:,sum)43.#printandInput,assignment44.print(Hello,I'mPython!)45.46.name=input('Whatisyourname?\n')47.print('Hi,%s.'%name)48.49.#testfor50.fruits=['Banana','Apple','Lime']51.loud_fruits=[fruit.upper()forfruitinfruits]52.print(loud_fruits)53.54.#open,writeandreadfile55.fo=open(./tmp/foo.txt,w+)56.fo.write(Pythonisageratlanguage.\nYeahitsgreat!!\nIamzhangyapeng,whoareyou?\n)57.t_str=u'我是张燕鹏,您是什么货色?'58.print(t_str)59.fo.write(t_str)60.fo.close()61.62.#readandwrite63.fr=open(./tmp/foo1.txt,r+)64.fw=open(foo_rw.txt,wb)65.done=0;66.localtime=time.asctime(time.localtime(time.time()))67.printLocalcurrenttime:,localtime68.fw.write(localtime+\n)69.whilenotdone:70.t_str=fr.readline()71.if(t_str!=''):72.printReadStringis:,t_str73.fw.write(t_str)74.else:75.done=176.fr.close()77.fw.close()78.79.#testtime(import)80.localtime=time.localtime(time.time())81.printLocalcurrenttime:,localtime82.#formatthetimefromtimeimportstrftime83.t_time=strftime('%Y-%m-%d%H:%M:%S',localtime)84.printformattinglocalcurrenttime:,t_time85.#designthetimebyyourself86.year=str(localtime.tm_year)87.mon=str(localtime.tm_mon)88.day=str(localtime.tm_mday)89.hour=str(localtime.tm_hour)90.mins=str(localtime.tm_min)91.sec=str(localtime.tm_sec)92.newtime=u时间是:+year+年+mon+月+day+日+hour+:+mins+:+sec93.printLocalcurrenttime:,newtime(4)运行图:(5)总结:(1)Python是一门入手非常快的语言,处理大数据的好语言,一些规范非常类似于c++语言,例如语法和一些函数命名,文件的打开和读写,以及读写方式,非常类似于c++(2)正如,开头所写的“python是胶水语言,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C++重写。”(3)分享一下非常基础的系统的学习网站(4)W3CSchool.cc(3)中提到的学习网站是非常基础的人们课程,要是想深入,具体的内容可以百度顶4踩1上一篇大数据处理之道(实验方法二)下一篇JavaWeb错误处理集锦我的同类文章数据挖掘&机器学习(15)algorithm(19)•数据挖掘与Web开发何去何从2015-12-26阅读794•大数据之道BitMap(按位存取)2015-01-26阅读906•大数据之道HMM系列二(成长)2015-01-19阅读785•大数据处理之道(GibbsSampling)2014-12-27阅读1098•大数据处理之道(实验方法二)2014-12-18阅读1131•优化算法无处不在2015-04-17阅读729•大数据处理之道(MATLAB篇三)2015-01-21阅读1209•大数据之道HMM系列2015-01-16阅读679•大数据处理之道(预处理方法)2014-12-23阅读1291•大数据处理之道(实验方法篇一)2014-12-17阅读940更多文章参考知识库Python知识库7346关注|805收录Hadoop知识库746关注|438收录JavaEE知识库1054关注|581收录JavaSE知识库9344关注|454收录JavaWeb知识库9629关注|1017收录ApacheSpark知识库2842关注|257收录猜你在找Python自动化开发实战视频课程-全新基础篇大数据编程语言:Java基础Python零基础到实战Spark1.x大数据平台ASP.NET企业网站开发项目实战查看评论6楼abigwhiteshark2015-03-0512:49发表[回复]python学习连接
本文标题:[置顶] 大数据处理之道(十分钟学会Python)
链接地址:https://www.777doc.com/doc-7027743 .html