十年網(wǎng)站開(kāi)發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶(hù) + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營(yíng)維護(hù)+專(zhuān)業(yè)推廣+無(wú)憂(yōu)售后,網(wǎng)站問(wèn)題一站解決
php采集程序構(gòu)建基本步驟:
成都創(chuàng)新互聯(lián)公司2013年開(kāi)創(chuàng)至今,先為康巴什等服務(wù)建站,康巴什等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢(xún)服務(wù)。為康巴什企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。
采集程序是什么?獲取遠(yuǎn)程數(shù)據(jù)(文字、圖片、圖片)并快速保存到本地或指定地址。
如天氣預(yù)報(bào)(小偷程序):
遠(yuǎn)程獲取--》替換內(nèi)容--》展示給用戶(hù)
如實(shí)時(shí)更新的新聞(采集內(nèi)容):
遠(yuǎn)程獲取--》提取內(nèi)容--》分類(lèi)存儲(chǔ)--》讀取內(nèi)容---》展示內(nèi)容
*************************
設(shè)計(jì)PHP采集入庫(kù)UML
列表正則:
終端正則:
**************************
file_get_contents()獲取遠(yuǎn)程頁(yè)面內(nèi)容
preg_match_all()匹配列表
preg_match()匹配終端
preg_replace() :過(guò)濾終端
**************************
新建一個(gè)列表文件:lb.php
echo $con=file_get_cotents($_GET[url]);
$preg ="#
pg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."
";
}
新建vi。php獲取標(biāo)題
vi.php
$con=file_get_contents();
$preg="
echo zz($preg,$con);
function zz($preg,$con,$num=1){
preg_match($preg,$con,$arr);
return $arr[$num];
}
echo $arr[1];//獲取標(biāo)題
echo "".arr[2][$id]."
";
======================================
php100:83:采集程序
lb.php
if($_GET[id]){
$con=file_get_cotents($_GET[url].$_GET[id]."shtml");
$preg ="/
perg_match_all($preg,$conn,$arr);
foreach($arr[1] as $id=>$v){
echo $v." "arr[2][$id]."
";
}
$_GET[id]++;
echo "";
}
?>
http://www.xinhuanet.com/finance/tzxx.htm
===============================================================
操作步驟:
1.新建一個(gè)數(shù)據(jù)庫(kù)caiji,tep_url表,id,title,content,11 ,100,150
2.新建一個(gè)conn.php,插入的語(yǔ)句可以通過(guò)phpmyadmin插入一個(gè)語(yǔ)句簡(jiǎn)單的獲得
3.新建一個(gè)vi.php
4.單條入庫(kù)獲取下一條。
臨時(shí)的路徑列表:
完善我的入庫(kù)表。
假設(shè)刪刪除了其中的一條Id值,怎么辦?刪除了第9條!
多加一條語(yǔ)句
$sql2="select * from tmp_url where id>'$gid'order by id asc limit 1