일을 하다가 특정 태그 사이의 텍스트를 추출 해야할 필요가 생겼다. p태그 사이에 있는 텍스트를 추출 해야하는데 p태그에 있는 클래스와 인라인 스타일 코드가 제각각이었고 p태그 안에 span태그가 또 껴있는 경우를 발견하였다. 1. HtmlDomParser를 이용해 본문 html을 추출 2. 정규식을 통해 p태그 추출 3. p태그 사이에 있는 태그 제거 // $html은 본문 // 본문의 html을 추출한다. $body_obj = HtmlDomParser::str_get_html($html);. // html을 문자열로 받는다. $html = $body_obj->outertext; // 텍스트 변수 $text = ''; // 줄바꿈 변수 $crlf = "\n"; // html요소들 중 p태그만 추출 $p..