240 私信
这个人很懒,暂无签名信息
  • 学好R语言绘图,你只需这样一个网站就够了

    话不多说,上网址:https://www.r-graph-gallery.com/r-garp-gallery收入了大量利用R语言绘制的图形,这些图形包含了很多方面,通过这个网站,我们可以方便直观观察到R语言所能做的一些图形。1. 简单介绍1. 网站对绘图进行了分类2. 网站提供搜索...

  • R语言入门 Chapter05 | 因子

    这篇文章讲述的是R语言中关于数据框的相关知识。希望这篇R语言文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter05 | 因子在R中名义型变量和有序性变量称为因子,factor。这些分类变量的可能值称为一个水平,level,例如good,better,b...

  • R语言入门 Chapter04 | 数据框

    这篇文章讲述的是R语言中关于数据框的相关知识。希望这篇R语言文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter04 | 数据框数据框的特点:1、数据框是一种表格式的数据结构。数据框旨在模拟数据集,与其他统计软件例如SAS或SPASS中的数...

  • R语言入门 Chapter03 | 列表

    这篇文章讲述的是R语言中关于列表的相关知识。希望这篇R语言文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter03 | 列表1、列表顾名思义就是用来存储很多内容的一个集合,在其他编程语言中,列表一般和数组是等同的,但是在R语言中,列...

  • R语言入门 Chapter02 | 矩阵与数组

    R语言中比较出名的矩阵iris3 state.x77#美国五十个州八个指标12使用heatmap()函数可以直接绘制热图矩阵其实就是给向量加一个维度1、创建矩阵>xx[1]12&nbs...

  • R语言入门 Chapter01 | 向量

    一、向量的概念及简单介绍1、概念向量,vector,是R中最重要的一个概念,它是构成其他数据结构的基础。R中的向量概念与数学之间的向量是不同的,类似于数学上的集合的概念,由一个或多个元素所构成。向量其实是用于存储数值型、字符型或逻辑型数据的一维数组...

  • 快速入门网络爬虫系列 Chapter16 | 爬虫性能提升

    一、基础简介1、任务调度操作系统通常采用时间片轮转的抢占式调度方式一个任务执行一段时间后强制暂停,去执行下一个任务每个任务轮流执行2、线程与进程2.1、进程具有独立功能的程序在数据集合上的一次动态执行过程系统进行资源分配和调度的一个独立单位任务...

  • 快速入门网络爬虫系列 Chapter15 | 验证码识别

    一、模拟登录知乎如果访问过于频繁,服务器要求输入验证码如果短时间内在知乎上频繁的登录退出,知乎就会要求输入验证码对于比较简单的字符型验证码,可以尝试用pytesseract库识别这些验证码pytesseract是一款用于光学字符识别的Python第三方库,可以从图片中...

  • 快速入门网络爬虫系列 Chapter13 | 模拟登陆

    一、什么是CookieCookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份、进行session跟踪而存储在用户本地终端上的数据(通常经过加密)。Cookie是小量信息,是由Web服务器创建的,将信息存放在用户计算机的文件上通过上述页面我们可以看到,登陆上...

  • 快速入门网络爬虫系列 Chapter12 | 将数据存储到数据库

    数据模型是现实生活中数据的抽象,用来描述数据的概念和定义,是数据库中数据的存储方式,是数据库系统的基础。常用的数据模型有以下三种:层次模型:以树形结构表示数据之间的关系网状模型:以网,图型结构表示数据之间的关系关系模型:以二维表结构表示数据...

  • 快速入门网络爬虫系列 Chapter11 | 将数据存储成文件

    通常,如果我们抓取的是图片、音频、视频、文档等内容,那么我们会把东西保存成文件。importrequests image_url='http://httpbin.org/image/png'file_path='test.png'response=requests.get(image...

  • 快速入门网络爬虫系列 Chapter10 | 数据结构化存储

    一、结构化过程1、非结构化数据《互联网大数据处理技术与应用》一书是由曾剑平编著,并由清华大学出版社于2017年出版。 清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。2、半结构化数据(书名:互联网大数据处理技术与...

  • 快速入门网络爬虫系列 Chapter09 | JSON数据处理

    一、JSONJSON是指JavaScript对象表示法(JavaScript Object Notation):独立于语言和平台与XML类似,存储和交换文本信息与XML语言更快、更易解析JSON的主要表达形式:单个JSON对象,书写格式为{string:value,string:value}1、获取JSON响应通过网络库requests,...

  • 快速入门网络爬虫系列 Chapter08 | 使用Python库抽取

    一、基础知识点1、XpathXML路径语言(XML Path Language,XPath)是一种用来确定XML文档中某部分位置的语言基于XML的树形结构,提供在数据结构树中找寻节点的能力Xpath可以用来标记XML和HTML语言的某一部分xml格式示例:与正则表达式相同,Xpath拥有自己的语法...

  • 快速入门网络爬虫系列 Chapter07 | 正则表达式

    一、网页介绍1、网站静态网站:纯粹采用HTML语言编写,内容不变动态网站:①服务器段动态生成:使用ASP、PHP等语言进行编写,在服务器端运行,根据浏览器请求的地址及参数,动态从数据库中读取数据,并填入预先写好的模板中,实时生成所需要的HTML网页,返回...

个人介绍
暂无介绍