HTML안의 href와 src의 주소만 빼내는 정규식
$pattern ='/(src=|href=)(\'|\")?([^<>\s\'\"]*)(\'|\"|\s|)/i';
preg_match_all( $pattern, $subject, $matches );
print_r($matches[3])
$str = HTML 내용
$url = HTML의 url;
function get_link_files($url,$str){
$url_arr = parse_url($url);
$domain = $url_arr['scheme'].'://'.$url_arr['host'];
if($url{strlen($url)-1}!='/'){
$path = $domain.$url_arr['path'];
}
else{ $path = $url; }
$pattern ='/(src=|href=)(\'|\")?([^<>\s\'\"]*)(\'|\"|\s|)/i';
$subject =&$str;
$matches = array();
preg_match_all( $pattern, $subject, $matches );
$r_arr = array();
$r = $matches[3];
$r2 = array();
unset($matches);//삭제
for($i =0,$m=count($r);$i<$m;$i++){ //경로 재계산
if($r[$i]{0}=='/'){
$r2[] = $domain.$r[$i];
}else if($r[$i]{1}=='/'){
$r2[] = $path.$r[$i];
}else if(strpos($r[$i],'http://')===0){
$r2[] = $r[$i];
}
}
print_r($r2);
}
'인터넷정보' 카테고리의 다른 글
[PHP] 한글 초성,중성,종성 자르기 (0) | 2007.10.10 |
---|---|
레이어로 툴팁 효과내기 (0) | 2007.10.10 |
window.document.location 간단 설명 (0) | 2007.10.10 |
로보트 검색엔진에 잘 걸리는 Meta Tag 작성법 (0) | 2007.10.10 |
화이트 도메인, 실시간 스팸 차단 리스트 (0) | 2007.10.10 |
쓸모있는 정규식 모음 JS버전 (0) | 2007.10.10 |
IE/FF(Gecko,W3C) 이벤트 설명 (0) | 2007.10.10 |
오른쪽마우스버튼,키보드 입력 방지,드래그금지, 특정키 제어 (0) | 2007.10.10 |
오픈마켓 광고, 옥션 광고, 지마켓 광고, 엠플 광고, 온켓 광고 (0) | 2007.10.10 |
폰트 사이트 (0) | 2007.10.10 |