亚洲成av人电影,成人性生交大片免费看在线播放,精品日韩欧美,国产精品麻豆99久久久久久

加盟網 |移動站| 招商名企 廣告合作:13123*12312 全國服務熱線:130*1234567 客服QQ:207179833
餐飲加盟
奶茶加盟 漢堡加盟 麻辣燙加盟 火鍋加盟 甜品店加盟 咖啡加盟 串串香加盟 炸雞店加盟 面包加盟 酸菜魚加盟 雞排加盟 燒烤加盟 糖水加盟 特色餐飲加盟 特色小吃加盟 鐵板燒加盟 土豆粉加盟 新奇特餐飲 湘菜加盟 小吃加盟 小吃車加盟 小籠包加盟 小龍蝦加盟 西餐加盟 西式快餐加盟 休閑食品加盟 鴨脖加盟 羊蝎子加盟 鴨血粉絲加盟 飲品加盟 魚火鍋加盟 早餐店加盟 中式快餐加盟 自助火鍋加盟 石鍋拌飯加盟 刨冰加盟 煲仔飯加盟 包子加盟 便當加盟 冰淇淋加盟 冰糖葫蘆加盟 披薩加盟 茶餐廳加盟 茶館加盟 炒貨加盟 茶葉加盟 重慶小面加盟 酸奶加盟 貢茶加盟 大米加盟 蛋糕店加盟 刀削面加盟 豆漿加盟 飯團加盟 夫妻肺片加盟 干鍋加盟 糕點加盟 鍋盔加盟 韓國料理加盟 日本料理加盟 果汁加盟 肉蟹煲加盟 黃燜雞米飯加盟 餛飩加盟 煎餅加盟 雞公煲加盟 進口食品加盟 筋頭巴腦加盟 烤雞加盟 烤肉加盟 烤鴨加盟 烤魚加盟 烤豬蹄加盟 快餐加盟 拉面加盟 涼茶加盟 涼皮加盟 零食加盟 鹵菜加盟 麻辣香鍋加盟 冒菜加盟 燜鍋加盟 面館加盟 面食加盟 調味品加盟 米線加盟 牛排加盟 牛肉餅加盟 牛肉面加盟 牛肉湯加盟 巧克力加盟 熱干面加盟 熱狗加盟 肉夾饃加盟 砂鍋加盟 燒鵝仔加盟 石鍋魚加盟 壽司加盟 水餃加盟 熟食加盟 酸辣粉加盟
母嬰加盟
兒童樂園 嬰兒游泳館 奶粉加盟 童車加盟 玩具加盟 母嬰用品加盟 兒童攝影加盟 月嫂加盟
珠寶加盟
黃金首飾加盟 水晶加盟 玉器加盟 鉆石加盟 銀飾加盟 彩寶加盟 珍珠加盟
女性加盟
彩妝加盟 化妝品加盟 護膚品加盟 美容美發加盟 美甲加盟 美容院加盟 女性項目 手工皂加盟 衛生巾加盟
教育加盟
早教加盟 少兒英語培訓加盟 幼兒園加盟 電腦培訓 教育培訓加盟 作文培訓 體育用品加盟 藝術培訓 潛能培訓 特長培訓加盟 寫作培訓 學生用品加盟 機器人教育培訓
飾品加盟
仿真花加盟 發飾加盟 工藝品加盟 家居飾品 精品飾品 民族飾品 女性飾品 情侶飾品 飾品店加盟 飾品加盟 十字繡加盟 手表加盟 眼鏡加盟
家居加盟
床上用品 凈水器加盟 家居裝飾 窗簾加盟 整體廚房 衣柜加盟 櫥柜加盟 衛浴加盟 電器加盟 家紡加盟 家具加盟 家居用品加盟 潔具加盟 節能燈加盟 空調加盟 樓梯加盟 墻紙加盟 熱水器加盟 生活館加盟 桶裝水加盟 鞋柜加盟 led燈具加盟 裝修加盟 布藝加盟 廚房電器 燈飾加盟 房產加盟 汗蒸房加盟
建材加盟
背景墻加盟 瓷磚加盟 吊頂加盟 地板加盟 門窗加盟 木門加盟 涂料加盟 磚廠加盟 集成墻板加盟
服裝加盟
女裝加盟 童裝加盟 男裝加盟 內衣加盟 運動服裝 襯衣加盟 皮具加盟 箱包加盟 品牌服裝 女包加盟 戶外用品 家居服 褲業加盟 牛仔加盟 情侶裝 親子裝 染衣加盟 少年裝加盟 睡衣加盟 絲襪加盟 T桖加盟 休閑裝 孕婦裝 羽絨服加盟
汽車加盟
汽車美容 汽車維修 電動車加盟 洗車加盟 汽車4S店加盟 補胎液 節油器 汽車零部件 輪胎加盟 汽車導航 汽車用品加盟 汽車裝飾 汽車項目 潤滑油加盟 停車場系統 洗車器 汽車租賃連鎖
當前位置: 首頁 > 創業資訊 > 零售加盟資訊 > 人人貸網(人人貸網的數據爬取)
溫馨提示:投資有風險,36加盟網提示多做項目考察!
人人貸網(人人貸網的數據爬取)
更新時間: 2025-01-22 11:51 作者: 36創業加盟網

人人貸網(人人貸網的數據爬取),36創業加盟網給大家帶來詳細的介紹,讓更多的人可以參考:人人貸網(人人貸網的數據爬取)。

之前看到過網上有一篇有關爬取P2P網站上散標投資數據和借貸人的信息數據的博文,后應他人請求,幫忙實現。發現存在不少問題,先整合前人資料(),說一下爬取中遇到的問題:

(一)首先分析"散標投資"這一個模塊,共有51個頁面

進入首頁,調用360瀏覽器的F12(界面如下)選擇Network->XHR

后在上圖中左側點擊到第2個頁面,右側那一欄會彈出3個事件(對其中Method為GET的那一個事件進行分析)

點擊Header,對General->Requesl URL, 和Request Headers->User-Agent 進行分析(后文中會用到)

仔細觀察Request URL:!json.action?pageIndex=2&_=1474379219318,你會發現數據是Json格式,查看下一頁,發現也是如此,不同頁面的數據格式是相同的。對此,我們的抓取思路就是:獲取網頁源代碼,從源代碼中提取數據。

數據來自于類似這樣的地址:!json.action?pageIndex=2&_=1457395836611,刪除&_=1457395836611后的鏈接依然有效人人貸網,打開鏈接發現是json格式的數據,而且數據就是當前頁面的數據。至此,我們就找到了真正的數據來源

以下就是爬取"散標列表"數據的代碼(Python 3.5.2 |Anaconda 4.0.0 (64-bit),低版本好像不能解析utf-8)

要想配置高版本見

import pandas as pd
import numpy as np
import requests
 
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'}
#headers得根據自己的瀏覽器F12下自行修改調整,具體可見步驟c
#自定義了一個解析網頁的函數
def parse_html(i):
    url = "http://www.we.com/lend/loanList!json.action?pageIndex=%s&" % i #數據的真正來源(Request URL)
    resp=requests.get(url,headers=headers) #獲取頁面
    html=resp.json() #頁面文字
    data=pd.DataFrame(html['data']['loans'])
    data.to_csv('loans%s.csv' % i) #將整理后的數據寫入csv格式文檔
    print("%s successsed" % i)
 

(頁面總共51個,可自己寫個循環語句,但循環過程中可能出錯,我自己就是一個個頁面爬取的,然后再把51個頁面的數據loan整合)

總的來說,第一步為得是給第二步做鋪墊,因為第二步需要用到第一步中loans.csv中的loanId,可自行將其單獨整理為一個csv文檔

(二)如何獲取借貸人信息

a.點擊其中一欄即可進入借貸人信息

為什么看不到借貸人信息呢,首先你的搞到一個帳號登錄即可見(自己隨便注冊一個啦)

b.帳號登錄后,按F12,剛開始又是空白,如下圖

這時只要刷新一下頁面,然后找到Method為Get的事件人人貸網,點擊打開

記住Request Headers->Cookie, 后面代碼需要用到它

c.爬取借貸人信息的源代碼

import pandas as pd
import re
import numpy as np
import requests
import time
import random
from bs4 import BeautifulSoup
s=requests.session()
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'}
#根據瀏覽器下自行修改
headers['Cookie'] = 'gr_user_id=022d0f46-4981-4224-9895-18bfe32d9276; rrdLoginCartoon=rrdLoginCartoon; pgv_pvi=905847926; Hm_lvt_16f9bb97b83369e62ee1386631124bb1=1474288518,1474332677,1474336816,1474368269; Hm_lpvt_16f9bb97b83369e62ee1386631124bb1=1474372985; JSESSIONID=7EB90C9967D8C42B08DFB18EB9A9F74ED2ACC468B7D56B9372E2A20684713847; jforumUserInfo=bEAY23pgyLLLjII69w9oS%2BtK2jljmxa8%0A; IS_MOBLIE_IDPASS=true-false; activeTimestamp=5195275; gr_session_id_9199126ed94d770d=70bbe285-4ac6-42c9-a49b-9255d0eb9c46; gr_cs1_70bbe285-4ac6-42c9-a49b-9255d0eb9c46=user_id%3A5195275'
#根據瀏覽器F12下的Request Headers->Cookie自行復制上去即可
def parse_userinfo(loanid):#自定義解析借貸人信息的函數
    timestamp=str(int(time.time())) + 'd' % random.randint(0,999)
urll="http://www.we.com/lend/detailPage.action?loanId=%.0f&timestamp=" % loanid+timestamp
#這個urll我也不知道怎么來的,貌似可以用urll="http://www.we.com/loan/%f" % loanid+timestamp
#(就是頁面本身,我也沒試過)

    result = s.get(urll,headers=headers)
    html = BeautifulSoup(result.text,'lxml')
    info = html.find_all('table',class_="ui-table-basic-list")
    info1= info[0]
    info2 = info1.find_all('div',class_="basic-filed")
    userinfo = {}
    for item in info2:
        vartag = item.find('span')
        var = vartag.string
        if var == '信用評級':
            var = '信用評分'
            pf1 = repr(item.find('em'))
            value = re.findall(r'\d+',pf1)
        else:
            valuetag = item.find('em')
            value = valuetag.string
        userinfo[var]=value
    data = pd.DataFrame(userinfo)
    return data
rrd=pd.read_csv('loanId.csv') #loanId是之前散標數據中的loanId,將其單獨整理為一個csv文檔
loanId=rrd.ix[:,'loanId']
user_info = ['昵稱', '信用評分',
            '年齡', '學歷', '婚姻',
            '申請借款', '信用額度', '逾期金額', '成功借款', '借款總額', '逾期次數','還清筆數', '待還本息', '嚴重逾期',
            '收入', '房產', '房貸', '車產', '車貸',
'公司行業', '公司規模', '崗位職位', '工作城市', '工作時間']
table = pd.DataFrame(np.array(user_info).reshape(1, 24), columns=user_info)
i = 1
for loanid in loanId:
    table = pd.concat([table, parse_userinfo(loanid)])
    print(i)
    i += 1 #看一下循環多少次
table.to_csv('userinfo.csv',header=False)

整理出來的數據可能會有點亂,但總的來說還是不錯的。(相信大家還是能清理的)

總結:以上內容就是人人貸網(人人貸網的數據爬取)詳細介紹,如果您對創業項目感興趣,可以咨詢客服或者文章下面留言,我們會第一時間給您項目的反饋信息。

我對人人貸加盟感興趣,馬上免費通話留言!

(24小時內獲得企業的快速回復)

溫馨提示:
1.此次通話將不會產生任何費用, 請放心使用

*姓名:
*電話:
QQ/Email:
投資金額:
加盟地區:
留言:

*為必填

7x24小時電話咨詢

130*1234567

您可以根據下列意向,快捷留言

  • 想要加盟煲飯堂,請盡快聯系
  • 煲飯堂加盟流程怎樣的?
  • 煲飯堂加盟費是多少錢?
  • 煲飯堂有哪些扶持政策?
  • 煲飯堂能實地考察嗎?
在線
咨詢
在線
留言
返回
頂部
主站蜘蛛池模板: 游戏| 广宗县| 琼海市| 辽宁省| 马关县| 大名县| 河南省| 弋阳县| 镇宁| 漾濞| 剑河县| 沈丘县| 杭锦后旗| 于都县| 洛南县| 蓬莱市| 来安县| 柳江县| 科尔| 秀山| 洪雅县| 宁阳县| 布拖县| 峨眉山市| 广德县| 呼伦贝尔市| 沙田区| 石嘴山市| 偏关县| 泸定县| 财经| 章丘市| 同德县| 绍兴县| 南澳县| 车致| 手游| 花莲市| 思南县| 奉节县| 普宁市|