您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 电子商务 > 电商销售数据分析(PPT33页)
LOGO电商销售记录分析严智强、贺强、刘瑞、崔亚松、臧茹歌Background网购流行电商崛起消费人群消费习惯潜在价值消费记录消费喜好分析市场方向Contentscontents电商数据天猫手机销售数据分析京东商城销售数据分析数据的获取与预处理替代商品的挖掘价格空洞的发现牛仔裤销售数据的分析用户消费记录的分析淘宝网作为国内第一大电商,占有近50%市场份额,而天猫商城则是所有优质店铺的集合,每月会产生大量销售数据,这里以天猫近一个月的手机销售数据进行分析,找出这些数据隐含的价值。天猫手机销售数据分析天猫手机销售数据分析数据的获取与预处理替代商品的挖掘价格空洞的发现数据的获取与处理构建一个爬虫脚本,从天猫上获取销量前600的手机销售记录,并匹配出每条记录的机型、售价、销量。Howtogetthedata爬虫脚本#coding=gbkimporturllibimportref1=open(r'E:\tmao\shoujihtml.txt')#此处存储了销量前600的网页地址http=f1.readlines()f1.close()f2=open(r'E:\tmao\shouji.txt','a')foriinhttp:content=urllib.urlopen(i.strip()).read()f2.write(content)f2.write('\n')f2.write('#'*50)f2.write('\n')f2.close()f3=open(r'E:\tmao\shouji.txt')lines=''forlineinf3.readlines():lines+=line.strip()f3.close()pattern=r'pclass=productPriceemtitle=(.*?).*?pclass=productTitle.*?target=_blanktitle=(.*?).*?pclass=productStatusspanem(.*?)/embr'result=re.findall(pattern,lines)f4=open(r'E:\tmao\shoujiInformation.txt','w')#该文件中存储了每件手机的记录(机型、售价、销量)foriteminresult:forjinrange(3):f4.write(item[j])f4.write('\t')f4.write('\n')f4.close()销量——价格散点图替代商品的挖掘我们认为,如果两件手机的售价和销量十分接近,则认为这两件手机互为替代商品。从网络营销的特点来看,从店铺的角度出发,选择进价更低的手机可获得更多利润。替代商品的挖掘我们以欧氏距离小于等于2为标准sqrt((a.price-b.price)^2+(a.sales_number-b.sales_number)^2)=2将手机聚类,找出互为替代的手机。替代商品的挖掘from__future__importdivisionfrommathimportsqrt#coding=gbkf1=open(r'E:\tmao\shoujiInformation.txt')records=f1.readlines()f1.close()price=[]number=[]product=[]foriinrange(len(records)):item=records[i].split('\t')price.append(item[0])product.append(item[1])number.append(item[2])foriinrange(len(price)):forjinrange(i+1,len(price)):distance=sqrt(pow((float(price[i])-float(price[j])),2)+pow((int(number[i])-int(number[j])),2))ifdistance=2:#ifthedistanceminuse2,weconsiderthetwoisreplacedproductprintproduct[i],'\t',product[j]else:pass所得结果结果发现,下列每一组中的手机互为替代商品(a)UMO/优摩w9220Yusun/语信T28(b)Huawei/华为C8812ZTE/中兴N807(c)OPPOU705TTCLY910T(d)Coolpad/酷派8150DZTE/中兴V889D(e)K-Touch/天语E800UMO/优摩W800七喜TD710(f)UMO/优摩W800七喜TD710Konka/康佳E5680(g)UniscopE/优思U1201Huawei/华为Y300-0000(h)Coolpad/酷派8050Coolpad/酷派E239(i)Motorola/摩托罗拉XT800索爱正品SA-I960安卓4.0(j)Coolpad/酷派8020Haier/海尔HT-I600(k)七喜H750Gionee/金立C620(l)Lenovo/联想A790E广信ef58(m)Huawei/华为c8810Samsung/三星s6108(n)AUX/奥克斯V930TCLY710(o)Philips/飞利浦W8355ONN/欧恩V816G版(p)TCLY710Gionee/金立GN705w价格空洞的发现经过分析,我们发现,作为中高端机营销,可选择3500-4000的价格空洞。可在较小压力下打入市场。京东商城销售数据分析牛仔裤销售数据分析用户消费记录的分析从生产厂家的角度来说,如果得到大量消费者的尺码大小及颜色偏好,则对生产和销售是非常有利的。因此,我们统计了京东女性牛仔裤的销售记录,从中得到各尺码和颜色在总的销售数据中的比例,从而指导生产。通过用户的消费记录,分析出用户的喜好品牌,从而当该品牌有新产品推出和促销活动时优先推荐给这些用户。牛仔裤销售数据分析用户尺码大小颜色偏好数据获取与预处理以爬虫程序从京东商城获取牛仔裤销售记录,并过滤出每个用户所购买的颜色、尺码。数据获取与预处理#coding=gbkimportreimporturllibpage=[16,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,12,12,12,12]#page记录了每件商品的评论页面数目f1=open(r'C:\Users\YANZHIQIANG\Desktop\jdongNiuZaiKuAdd.txt')#goods存储商品评论地址goodslist=f1.readlines()f1.close()s1=r'E:\jdong\niuzaikupinglunAdd's3='.txt'foriinrange(0,len(goodslist)):forjinrange(1,page[i]+1):content=urllib.urlopen(goodslist[i].strip()+str(j)+'-0.html').read()printgoodslist[i].strip()+str(j)+'-0.html'save=s1+str(i)+s3f2=open(save,'a')f2.write(content)f2.write(goodslist[i].strip()+'page'+str(j)+'downloaded\n')f2.write('#####\n')f2.close()s1=r'E:\jdong\niuzaikupinglunAdd's3='.txt'数据获取与分析foriinrange(0,35):s=s1+str(i)+s3f=open(s)lines=''forlineinf.readlines():lines+=line.strip()f.close()color=r'dt颜.*?色:/dtdd(.*?)/dd'size=r'dt尺.*?码:/dtdd(.*?)/dd'date=r'dt购买日期:/dtdd(.*?)/dd'multiColor=re.findall(color,lines)print'file',i,'has',len(multiColor),'colorrecords\n'multiSize=re.findall(size,lines)print'file',i,'has',len(multiSize),'sizerecords\n'multiDate=re.findall(date,lines)print'file',i,'has',len(multiDate),'daterecords\n'f1=open(s1+str(i)+'color'+s3,'w')forcinmultiColor:f1.write(c)f1.write('\n')f1.close()f2=open(s1+str(i)+'size'+s3,'w')forsinmultiSize:f2.write(s)f2.write('\n')f2.close()f3=open(s1+str(i)+'date'+s3,'w')fordinmultiDate:f3.write(d)f3.write('\n')f3.close()用户尺码大小与颜色偏好挖掘#coding=gbkimportrename=['白','黑','粉','枣红','酒红','大红','红','紫','绿','杏','黄','棕','宝蓝','彩蓝','海蓝','深蓝','浅蓝','灰蓝','中蓝','天蓝','墨兰','墨蓝','藏蓝','蓝','橙','灰']countColor=[0*iforiinrange(len(name))]f1=open(r'E:\jdong\allNiuZaiKuColor.txt')color=f1.readlines()f1.close()forjincolor:forkinrange(0,len(name)):ifre.search(name[k],j):countColor[k]=countColor[k]+1breakf2=open(r'E:\jdong\colorSummary.txt','a')d=dict(zip(name,countColor))forkeyind.keys():f2.write(str(key)+'\t'+str(d[key]))f2.write('\n')f2.close()daxiao=[str(i)foriinrange(10,36)]countSize=[i*0foriinrange(len(daxiao))]f3=open(r'E:\jdong\allNiuZaiKuSize.txt')size=f3.readlines()f3.close()用户尺码大小与颜色偏好挖掘forainsize:forbinrange(0,len(daxiao)):ifre.search(daxiao[b],a.strip()):countSize[b]=countSize[b]+1breakelifre.search('^XS$',a.strip()):countSize[14]=countSize[14]+1breakelifre.search('^S$',a.strip()):countSize[15]=countSize[15]+1breakelifre.search('^M$',a.strip()):countSize[16]=countSize[16]+1breakelifre.search('^L$',a.strip()):countSize[17]=countSize[17]+1breakelifre.search('^XL$',a.strip()):co
本文标题:电商销售数据分析(PPT33页)
链接地址:https://www.777doc.com/doc-33547 .html