python大数据抓取京东电脑销量数据

laical1   发布于 2021年07月07日   阅读次数: 107   

Tag: 爬虫

最近很多同学在咨询买电脑的事,尤其是刚高考完的准大学生们。因为到了大学之后,很多新生都想买一台电脑,这样可以很好的完成老师布置的作业,而且自己也可以想什么时候使用电脑都行,比较方便自己。那么,您知道大一新生买电脑的时候需要注意什么吗?
1、注意电脑的配置问题,大学用电脑主要是学习为主,那么配置上就不需要太高,如果是另有他用就可以高些。
2、需要看看电脑的内存问题,内存有2G、4G、8G等,如果只是用来学习的话,一般选择4G内存的电脑就可以了,如果要玩游戏的话,最好选择内存大一些的。还有一些其他注意事项大家可以多多了解下,
那么对即将到来的购买电脑旺季,我们今天就通过获取京东上的笔记本的好评论数,价格,店铺等信息,并做一个可视化,根据可视化的图,大家可以清晰的做出预测,方便大家购买划算的电脑。
// 要访问的目标页面
string targetUrl = "https://www.jd.com/";


// 代理服务器(产品官网 www.16yun.cn)
string proxyHost = "http://t.16yun.cn";
string proxyPort = "31111";

// 代理验证信息
string proxyUser = "16URTHTV";
string proxyPass = "458350";

// 设置代理服务器
WebProxy proxy = new WebProxy(string.Format("{0}:{1}", proxyHost, proxyPort), true);


ServicePointManager.Expect100Continue = false;

var request = WebRequest.Create(targetUrl) as HttpWebRequest;

request.AllowAutoRedirect = true;
request.KeepAlive = true;
request.Method    = "GET";
request.Proxy     = proxy;

//request.Proxy.Credentials = CredentialCache.DefaultCredentials;

request.Proxy.Credentials = new System.Net.NetworkCredential(proxyUser, proxyPass);

// 设置Proxy Tunnel
// Random ran=new Random();
// int tunnel =ran.Next(1,10000);
// request.Headers.Add("Proxy-Tunnel", String.valueOf(tunnel));


//request.Timeout = 20000;
//request.ServicePoint.ConnectionLimit = 512;
//request.UserAgent = "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.82 Safari/537.36";
//request.Headers.Add("Cache-Control", "max-age=0");
//request.Headers.Add("DNT", "1");


//String encoded = System.Convert.ToBase64String(System.Text.Encoding.GetEncoding("ISO-8859-1").GetBytes(proxyUser + ":" + proxyPass));
//request.Headers.Add("Proxy-Authorization", "Basic " + encoded);

using (var response = request.GetResponse() as HttpWebResponse)
using (var sr = new StreamReader(response.GetResponseStream(), Encoding.UTF8))
{
    string htmlStr = sr.ReadToEnd();
通过数据分析我们可以看出来很多人偏向选择联想,这里只是给大家一个购买时的参考,具体的还是需要根据自己的需求和喜好进行购买。
如果你觉得文章还不错,请大家点赞分享下。你的肯定是我最大的鼓励和支持。