爬取人大經(jīng)濟(jì)論壇問題?
這是搜索頁(yè)
http://s.pinggu.org/search.ph...
這是請(qǐng)求時(shí)候看到的內(nèi)容
這里有兩個(gè)問題,
在form data里面有兩個(gè)數(shù)據(jù)不知怎么獲取。
一個(gè)是srchtxt,這個(gè)應(yīng)該是搜索的那個(gè)字段,要怎么處理拼接進(jìn)來。
另外一個(gè)是:formhash,這個(gè)可以在元素頁(yè)面可以看到
但是這個(gè)也是在post搜索<愛尬聊_讓生活聊出新高度>之后才有的,所以就是不知要怎么處理這兩個(gè)字段。
李文帥 1天前
formhash就按樓上說的去訪問兩次就可以了srchtxt。。。你自己爬取的時(shí)候肯定要自己寫關(guān)鍵字阿。。。要不爬啥啊
sheila帥 23小時(shí)前
第一個(gè) formhash
的獲取,再搜索之前,事先訪問一下http://s.pinggu.org/search.php
這個(gè)連接,這個(gè)時(shí)候,就會(huì)產(chǎn)生formhash這個(gè)字段了。另外一個(gè)字段出現(xiàn)亂碼,我猜測(cè)的原因是,這個(gè)網(wǎng)頁(yè)采用的gbk編碼,所以說你傳值的時(shí)候,也改變編碼即可。