일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- DFS
- 동적 프로그래밍
- OS
- 그래프
- 코딩
- 프로그래머스
- 파이썬
- 알고리즘
- 프로그래밍
- 리눅스
- AI
- 브루트포스
- 네트워크
- dp
- linux
- kick start
- 운영체제
- BFS
- 코딩테스트
- 킥스타트
- 동적프로그래밍
- CSS
- PYTHON
- 딥러닝
- google coding competition
- 구글 킥스타트
- 백준
- 순열
- nlp
- 코딩 테스트
- Today
- Total
목록크롤링 (2)
오뚝이개발자

학교 수업의 프로젝트 일환으로 외국인들에게 한식을 소개하는 어플을 제작했다. 해당 프로젝트에서 내가 담당했던 부분은 데이터 파트를 구축하는 일이었는데, 이를 위해 만개의 레시피를 크롤링하는 부분을 구현하였다. 식약처 API(첫번째 시도) 처음엔 식약처에 제공하는 API를 사용하였다. 해당 링크는 아래와 같다. http://www.foodsafetykorea.go.kr/api/openApiInfo.do?menu_grp=MENU_GRP31&menu_no=661&show_cnt=10&start_idx=1&svc_no=COOKRCP01 데이터활용서비스 설명 속성정보 일련번호 , 메뉴명 , 조리방법 , 요리종류 , 중량(1인분) , 열량 , 탄수화물 , 단백질 , 지방 , 나트륨 , 해쉬태그 , 이미지경로(소) ..
AI를 구현하다보면 많은 이미지 데이터들이 필요한데 크롤링을 통해 손쉽게 이미지를 저장할 수 있다. 물론 request를 사용하여 html 구조를 분석한 뒤 해당 이미지를 긁어오는 방법도 있지만 이미 만들어진 google_images_download라는 편리한 모듈이 있다. 여기선 해당 모듈의 설치방법과 사용예시를 설명한다. 참고로 pip install google_images_download를 사용해 이미 해당 모듈을 설치했다면 pip uninstall로 삭제를 한뒤 아래의 설치를 진행해야 한다.(업데이트로 인해 기존의 방법으로 설치했을 경우 크롤링이 안되는 에러가 발생한다) 설치하기 커맨드 창에 "pip install git+https://github.com/Joeclinton1/google-imag..