파이썬 코딩 저널_1

스파르타 코딩 동아리에서 인벤토리 데이터를 이용한 Python 데이터 분석 코스를 했습니다.
Colab으로 Python을 배웠지만 설치하지 않고
열어서 어디에서나 사용할 수 있다는 것은 정말 큰 장점인 것 같습니다.

할퀴다

pip install bs4 요구 사항 -> 코드 다운로드

수입 요청 -> 웹사이트 스크래핑

에서 bs4 수입 좋은 수프


데프 뉴스를 얻다(예어):
제목 = {‘사용자 에이전트’ : ‘Mozilla/5.0(Windows NT 10.0; Win64; x64)AppleWebKit/537.36(Gecko와 같은 KHTML) Chrome/73.0.3683.86 Safari/537.36’}
데이터 = 요청.get(에프https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={예어},제목=제목)


수프 = BeautifulSoup(data.text, ‘html.파서’)


리스 = 수프. 선택하다(‘#main_pack > 섹션 > div > div.group_news > ul>li’)


~을 위한 왼쪽 ~ 안에 목록:
a = 왼쪽 하나를 고르세요(‘a.news_tit’)
누르다(a. 텍스트, a(‘href’))


뉴스를 얻다(“현대 엔진”)
뉴스를 얻다(‘LG전자’)

엑셀 사용

pip install openpyxl -> 다운로드 코드

에서 openpyxl 수입 통합 문서 -> Excel 파일 생성

wb = 워크북()
시트 = wb. 활동적인

시트(‘A1’) = ‘안녕하세요!’

wb.저장(“예시 파일.xlsx”)
wb.닫기()
수입 openpyxl -> 엑셀 파일 읽기
wb = openpyxl.load_workbook(‘예시 파일.xlsx’)
시트 = wb(‘나뭇잎’)


시트(‘A1’).값

파일 다운로드, 이름 바꾸기

!zip -r /content/files.zip /content/news -> zip 파일
수입 os -> 파일명 변경

경로 = ‘/콘텐츠/뉴스’
이름 = os. 목록 디렉토리(경로)

~을 위한~ 안에 이름:
new_file = name.split(‘.’)(0) + ‘(메시지).xlsx’
os.rename(경로+‘/’+이름,경로+‘/’+새_파일)

이미지 다운로드

수입 urllib.요청

urllib.request.urlretrieve(url, “삼성.jpg”)

작업 주 1


수입 openpyxl
수입 urllib.요청

wb = openpyxl.load_workbook(‘관리 요소.xlsx’)
시트 = wb(‘사례’)

new_rows = 목록(시트. 라인)(하나🙂

~을 위한~ 안에 new_rows:
URL = 에프https://ssl.pstatic.net/imgfinance/chart/item/area/year3/{열(하나).값}.png’
urllib.request.urlretrieve(URL, 에프“작업 주 1/{열(0).값}.png”)

중간에 실수가 있어서 스트레스도 받고 힘들었지만 일단 문제를 풀고 나니,

성취감도 있고 결과도 바로 보여서 재밌을 것 같아요. 5주차까지 끝내야지!