스파르타 코딩 동아리에서 인벤토리 데이터를 이용한 Python 데이터 분석 코스를 했습니다.
Colab으로 Python을 배웠지만 설치하지 않고
열어서 어디에서나 사용할 수 있다는 것은 정말 큰 장점인 것 같습니다.
https://colab.research.google.com/notebooks/welcome.ipynb
협력 파트너에 오신 것을 환영합니다
Python 노트북 실행, 공유 및 편집
colab.research.google.com
할퀴다
pip install bs4 요구 사항 -> 코드 다운로드
수입 요청 -> 웹사이트 스크래핑
에서 bs4 수입 좋은 수프
데프 뉴스를 얻다(예어):
제목 = {‘사용자 에이전트’ : ‘Mozilla/5.0(Windows NT 10.0; Win64; x64)AppleWebKit/537.36(Gecko와 같은 KHTML) Chrome/73.0.3683.86 Safari/537.36’}
데이터 = 요청.get(에프‘https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={예어}‘,제목=제목)
수프 = BeautifulSoup(data.text, ‘html.파서’)
리스 = 수프. 선택하다(‘#main_pack > 섹션 > div > div.group_news > ul>li’)
~을 위한 왼쪽 ~ 안에 목록:
a = 왼쪽 하나를 고르세요(‘a.news_tit’)
누르다(a. 텍스트, a(‘href’))
뉴스를 얻다(“현대 엔진”)
뉴스를 얻다(‘LG전자’)
엑셀 사용
pip install openpyxl -> 다운로드 코드
에서 openpyxl 수입 통합 문서 -> Excel 파일 생성
wb = 워크북()
시트 = wb. 활동적인
시트(‘A1’) = ‘안녕하세요!’
wb.저장(“예시 파일.xlsx”)
wb.닫기()
수입 openpyxl -> 엑셀 파일 읽기
wb = openpyxl.load_workbook(‘예시 파일.xlsx’)
시트 = wb(‘나뭇잎’)
시트(‘A1’).값
파일 다운로드, 이름 바꾸기
!zip -r /content/files.zip /content/news -> zip 파일
수입 os -> 파일명 변경
경로 = ‘/콘텐츠/뉴스’
이름 = os. 목록 디렉토리(경로)
~을 위한 성 ~ 안에 이름:
new_file = name.split(‘.’)(0) + ‘(메시지).xlsx’
os.rename(경로+‘/’+이름,경로+‘/’+새_파일)
이미지 다운로드
수입 urllib.요청
urllib.request.urlretrieve(url, “삼성.jpg”)
작업 주 1
수입 openpyxl
수입 urllib.요청
wb = openpyxl.load_workbook(‘관리 요소.xlsx’)
시트 = wb(‘사례’)
new_rows = 목록(시트. 라인)(하나🙂
~을 위한 열 ~ 안에 new_rows:
urllib.request.urlretrieve(URL, 에프“작업 주 1/{열(0).값}.png”)
중간에 실수가 있어서 스트레스도 받고 힘들었지만 일단 문제를 풀고 나니,
성취감도 있고 결과도 바로 보여서 재밌을 것 같아요. 5주차까지 끝내야지!