정규표현식으로 태그 추출하기
문제 선수 리스트에 시세 데이터를 추출하려던 중, 다음과 같은 형태의 태그들을 만났습니다. 다음과 같이 일반적으로는 추출하지 못합니다. from bs4 import BeautifulSoup as bs with open('sample.html', 'r', encoding='utf-8') as f: text = f.read() html = bs(text, 'html.parser') items = html.find_all('div', {'class': 'tr'}) print(f'item count: {len(items)}') result = [] for item in items: bp = [t.get_text() for t in item.find_all('span', {'class': 'span_bp'})] ..