python中http请求demo是如何,返回数据结果如何解析?

2020-05-21 19:39发布

4条回答
苏橙C
2楼 · 2020-05-21 20:47
以下代码调试通过:
import pandas as pd
import json

demo = '{"programmers": [{"firstName": "Brett","lastName": "McLaughlin","email": "aaaa"}, { "firstName": "Jason","lastName": "Hunter","email": "bbbb"}, {"firstName":"Elliotte","lastName": "Harold","email": "cccc"}],"authors": [{"firstName": "Isaac","lastName": "Asimov","genre": "sciencefiction"}, {"firstName": "Tad","lastName": "Williams","genre": "fantasy"}, {"firstName": "Frank","lastName": "Peretti","genre": "christianfiction"}],"musicians": [{"firstName": "Eric", "lastName": "Clapton","instrument": "guitar"}, {"firstName": "Sergei","lastName": "Rachmaninoff","instrument": "piano"}]}'
demojs = json.loads(demo)
print('\n', 'demojs: ', demojs)
Aurdata = pd.DataFrame(demojs['authors'])
print('\n', 'Aurdata:\n', Aurdata)


爱梦 - 拿来吧你
3楼 · 2021-10-26 09:32
#! /usr/bin/env python
  # -*- coding:gbk -*-
 
  import os
  import sys
  import json
  import urllib
  import urllib2
 
  if __name__ == "__main__":
    query_file = sys.argv[1]
    query_index = 0
    with open(query_file, 'r') as fp:
      for line in fp:
        query = line.rstrip()
        query_index = query_index + 1
        query_gbk = query
        query = query.decode('gbk', 'ignore').encode('utf8', 'ignore')
        url = 'http://10.42.141.12:8089/adrender?query=%s&ad_num=3&srcid=101'\\
           '&ip=172.22.182.55&baiduid=61ABB404320C72436EB6B8352DFBB388:FG=1' % (query)
        req = urllib2.urlopen(url)
        page = req.read()
        ddict = json.loads(page)
        expid = ddict['expid']
        sid = ddict['sid']
        ad_num = ddict['response_adnum']
        for i in range(0, ad_num):
          output_html = '%s-%d.html' % (query_gbk, i)
          output = open(output_html, 'w')
          ad = ddict['response_ads'][i].encode('utf8', 'ignore')
          output.write('\')
          output.write('\  \\')
          output.write("%s" % (ad))
          output.write('\\')
          output.close()


超甜的布丁
4楼 · 2021-10-26 11:17

您可能需要签出^{},因为它似乎可以执行更多您想要的操作:Parses an XML section into an element tree incrementally, and reports what’s going on to the user. source is a filename or file object containing XML data. events is a list of events to report back. If omitted, only “end” events are reported. parser is an optional parser instance. If not given, the standard XMLParser parser is used. Returns an iterator providing (event, elem) pairs.

然后,您可以编写一个生成器,使用迭代器,执行您想要的操作,并生成所需的值。

例如:def find_spam(xml):

for event, element in xml.etree.ElementTree.iterparse(xml):

if element.tag == "spam":

print("We found a spam!")

# Potentially do something

yield element

区别主要在于你想要什么。ElementTree的迭代器方法更多的是收集数据,而SAX方法更多的是对数据进行操作。


慢半拍
5楼 · 2021-10-27 14:57

解析请求报文

核心代码

 /* 解析请求行 */
 int parse_start_line(int sockfd, char *recv_buf, req_pack *rp)
 {  char *p = recv_buf;  
 char *ch = p;  
 int i = 0;  
 enum parts { method, url, ver } req_part = method;  
 char *method_str;  
 char *url_str;  
 char *ver_str;  
 int k = 0;  
 if (*ch < 'A' || *ch > 'Z') {   
 return -1;
  }  
 while (*ch != CR) {   
 if (*ch != BLANK) {    
 k++;
   } else if (req_part == method) {
    method_str = (char *)malloc(k * sizeof(char *));    
 memset(method_str, 0, sizeof(char *));    
 strncpy(method_str, recv_buf, k);
    k = 0;
    req_part = url;
   } else if (req_part == url) {
    url_str = (char *)malloc(k * sizeof(char *));    
 memset(url_str, 0, sizeof(char *));    
 strncpy(url_str, recv_buf + strlen(method_str) + 1, k);
    k = 0;
    req_part = ver;
   }
   ch++;
   i++;
  }  if (req_part == url) {   
 if (k != 0) {
    url_str = (char *)malloc(k * sizeof(char));    
 memset(url_str, 0, sizeof(char));    
 strncpy(url_str, recv_buf + strlen(method_str) + 1, k);
    k = 0;
   } else {    
 return -1;
   }
  }  if (k == 0) {
   ver_str = (char *)malloc(8 * sizeof(char));   
 memset(ver_str, 0, sizeof(char));   
 strcpy(ver_str, "HTTP/1.1");
  } else {
   ver_str = (char *)malloc(k * sizeof(char));   
 memset(ver_str, 0, sizeof(char));   
 strncpy(ver_str,     
 recv_buf + strlen(method_str) + strlen(url_str) + 2, k);
  }

  rp->method = method_str;
  rp->url = url_str;
  rp->version = ver_str;  
 return (i + 2);
 } /* 解析首部字段 */
 int parse_header(int sockfd, char *recv_buf, header headers[])
 {  char *p = recv_buf;  
 char *ch = p;  
 int i = 0;  
 int k = 0;  
 int v = 0;  
 int h_i = 0;  
 bool is_newline = false;  
 char *key_str;  
 char *value_str;
  header *tmp_header = (header *)malloc(sizeof(header *));  
 memset(tmp_header, 0, sizeof(header));  
 while (1) {   
 if (*ch == CR && *(ch + 1) == LF) {    
 break;
   }   
 while (*ch != COLON) {
    ch++;
    i++;
    k++;
   }   
 if (*ch == COLON) {
    key_str = (char *)malloc(k * sizeof(char *));    
 memset(key_str, 0, sizeof(char *));    
 strncpy(key_str, recv_buf + i - k, k);
    k = 0;
    ch++;
    i++;
   }   
 while (*ch != CR) {
    ch++;
    i++;
    v++;
   }   
 if (*ch == CR) {
    value_str = (char *)malloc(v * sizeof(char *));    
 memset(value_str, 0, sizeof(char *));    
 strncpy(value_str, recv_buf + i - v, v);
    v = 0;
    i++;
    ch++;
   }
   i++;
   ch++;
   headers[h_i].key = key_str;
   headers[h_i].value = value_str;
   h_i++;
  }  return (i + 2);
 }

解析思想

遍历recv接受到的请求字符串,检查是否遇到回车符\r判断一行数据。

对于起始行,检查是否遇到空格分隔不同的字段;对于首部,检查是否遇到冒号分隔键值对的字段值;对于实体的主体部分,则先判断是否遇到CRLF字符串,然后将剩余内容全部作为实体的主体部分。

返回值是告知程序下一次遍历的起始位置。

如果遇到非法请求行则返回400的响应。


相关问题推荐

  • 回答 3

    换行。比如,print hello\nworld效果就是helloworld\n就是一个换行符。\是转义的意思,&#39;\n&#39;是换行,&#39;\t&#39;是tab,&#39;\\&#39;是,\ 是在编写程序中句子太长百,人为换行后加上\但print出来是一整行。...

  • 回答 42

    十种常见排序算法一般分为以下几种:(1)非线性时间比较类排序:a. 交换类排序(快速排序、冒泡排序)b. 插入类排序(简单插入排序、希尔排序)c. 选择类排序(简单选择排序、堆排序)d. 归并排序(二路归并排序、多路归并排序)(2)线性时间非比较类排序:...

  • 回答 70
    已采纳

    前景很好,中国正在产业升级,工业机器人和人工智能方面都会是强烈的热点,而且正好是在3~5年以后的时间。难度,肯定高,要求你有创新的思维能力,高数中的微积分、数列等等必须得非常好,软件编程(基础的应用最广泛的语言:C/C++)必须得很好,微电子(数字电...

  • 回答 28

    迭代器与生成器的区别:(1)生成器:生成器本质上就是一个函数,它记住了上一次返回时在函数体中的位置。对生成器函数的第二次(或第n次)调用,跳转到函数上一次挂起的位置。而且记录了程序执行的上下文。生成器不仅记住了它的数据状态,生成器还记住了程序...

  • 回答 9

    python中title( )属于python中字符串函数,返回’标题化‘的字符串,就是单词的开头为大写,其余为小写

  • 回答 6

    第一种解释:代码中的cnt是count的简称,一种电脑计算机内部的数学函数的名字,在Excel办公软件中计算参数列表中的数字项的个数;在数据库( sq| server或者access )中可以用来统计符合条件的数据条数。函数COUNT在计数时,将把数值型的数字计算进去;但是...

  • 回答 1

    head是方法,所以需要取小括号,即dataset.head()显示的则是前5行。data[:, :-1]和data[:, -1]。另外,如果想通过位置取数据,请使用iloc,即dataset.iloc[:, :-1]和dataset.iloc[:, -1],前者表示的是取所有行,但不包括最后一列的数据,结果是个DataFrame。...

  • Python入门简单吗2021-09-23 13:21
    回答 45

    挺简单的,其实课程内容没有我们想象的那么难、像我之前同学,完全零基础,培训了半年,直接出来就工作了,人家还在北京大公司上班,一个月15k,实力老厉害了

  • 回答 4

    Python针对众多的类型,提供了众多的内建函数来处理(内建是相对于导入import来说的,后面学习到包package时,将会介绍),这些内建函数功用在于其往往可对多种类型对象进行类似的操作,即多种类型对象的共有的操作;如果某种操作只对特殊的某一类对象可行,Pyt...

  • 回答 8

     相当于 ... 这里不是注释

  • 回答 4

    还有FIXME

  • 回答 3

    python的两个库:xlrd和xlutils。 xlrd打开excel,但是打开的excel并不能直接写入数据,需要用xlutils主要是复制一份出来,实现后续的写入功能。

  • 回答 8

    单行注释:Python中的单行注释一般是以#开头的,#右边的文字都会被当做解释说明的内容,不会被当做执行的程序。为了保证代码的可读性,一般会在#后面加一两个空格然后在编写解释内容。示例:#  单行注释print(hello world)注释可以放在代码上面也可以放在代...

  • 回答 2

    主要是按行读取,然后就是写出判断逻辑来勘测行是否为注视行,空行,编码行其他的:import linecachefile=open(&#39;3_2.txt&#39;,&#39;r&#39;)linecount=len(file.readlines())linecache.getline(&#39;3_2.txt&#39;,linecount)这样做的过程中发现一个问题,...

  • 回答 4

    或许是里面有没被注释的代码

  • 回答 26

    自学的话要看个人情况,可以先在B站找一下视频看一下

没有解决我的问题,去提问