본문 바로가기

분류 전체보기

네이버 1784 탐방 후기 2022년 10월 16일 일요일 여자친구와 계원고에서 뮤지컬을 본 후 근처에 어딜 가볼까 하다 네이버 지도에 떡하니 그려져있는 naver 본사가 눈에 띄었다. 이건 안가볼 수 없었다. 대기업 본사를 직접 보는 건 처음이었다. 설레는 마음으로 발걸음을 서둘러 옮겼다. 네이버 본사에 가보니 불이 다 꺼져있었다. 분명 네이버 카페는 영업중이라 떴는데.. 그래도 바로 뒤에 스타벅스가 있는 걸 발견해 가보았다. 스타벅스가 있다는 건물 1층에 가보니 스타벅스는 발견 못하고 입이 떡벌어지는 건물의 스케일에 놀랐다. 미래지향적인 내관이었다.. 엄청 멋있었다. 알고보니 여기가 naver 신사옥 'naver 1784'였다. 여자친구와 계속 우와 우와하면서 둘러봤다. 근데 정작 스타벅스는 보이지 않았다 ㅎㅎ.. 마냥 돌아다.. 더보기
[AI SCHOOL] Mini_Project_1 (주제:국내 프랜차이즈 카페 전국 매장 정보) 1. 주제 선정 멋쟁이 사자처럼 AI SCHOOL에서 진행한 첫 미니 프로젝트이다. 새로운 팀원들과 진행하는 첫 미니프로젝트이다. 미니프로젝트는 미드프로젝트나 파이널프로젝트와는 달리 따로 인사이트까지 도출하지는 않고 주제를 선정하여 수업시간에 배웠던 내용들을 사용해보는 간단한 프로젝트이다. 그래도 수업시간에 배웠던 내용들을 다른 곳에 스스로 적용시켜서 사용해볼 생각에 설랬다. 이번 프로젝트에서 팀원들끼리 의견을 공유하고 투표하여 선택한 주제는 '전국 프렌차이즈 카페 매장 찾기' 였다. 이 주제의 목표는 프렌차이즈 매장들의 리스트를 뽑아 팀원들끼리 각자 하나의 카페를 선택하여 그 카페의 전국 매장 위치를 찾고 모든 데이터들을 합쳐보는 것이다. 나는 '메가커피'를 선택했고 메가커피의 전국 매장의 위치를 찾을.. 더보기
[SQL] 조건문 IF와 CASE 1. IF 문 IF(조건, 조건이 True일 때, False일 때) 조건이 하나일 때만 사용 SELECT IF(col_1 >= 30 , '크다', '작다')# col_1이 30보다 크면 '크다'를 30보다 작으면 '작다'를 출력 FROM table 2. CASE 문 CASE WHEN (A조건) THEN (A조건이 True일 때) WHEN (B조건) THEN (B조건이 True일 때) ELSE (위 조건이 모두 False일 때) END 조건이 두개 이상일 때 사용(하나여도 사용 가능) SELECT CASE WHEN col_1 >= 30 THEN '크다'# col1이 30 이상이면 '크다'를 WHEN col_1 < 10 THEN '작다'# 10 미만이면 '작다'를 ELSE '보통이다' END# 10 이상 3.. 더보기
[Pandas] 데이터 수집 - 웹스크래핑(Json) 네이버 금융에서 ETF 리스트 스크래핑하기(크롬에서 가능) 1. 데이터 수집하기 네이버 금융에서 ETF 사이트에 들어갑니다. https://finance.naver.com/sise/etf.nhn 개발자도구(f12)에 들어가 Network 탭에서 '전체' 항목의 url을 찾아줍니다. url에서 callback은 불필요하므로 지워줍니다. callback을 지우고 url의 정보를 봐보면 json인 것을 확인할 수 있습니다. 필요한 라이브러리를 불러오고 requests.get을 이용하여 url을 가져옵니다. import pandas as pd import numpy as np import requests url = 'https://finance.naver.com/api/sise/etfItemList.nhn?et.. 더보기
[Pandas] 데이터 수집 - 웹스크래핑 네이버 금융 홈페이지에서 종목 뉴스 스크래핑하기(크롬에서 가능) 1. 데이터 수집하기 네이버 금융 홈페이지에서 원하는 종목을 검색하여 들어갑니다. https://finance.naver.com/item/news.naver?code=005930 개발자 도구(f12)에 들어가 Network 탭에서 종목뉴스에 관한 URL을 찾아줍니다. 필요한 라이브러리를 불러오고 pd.read_html()을 사용하여 url 안에 내용을 불러옵니다. import pandas as pd import numpy as np item_name = '삼성전자' item_code = '005930' page_no = 1 url = f'https://finance.naver.com/item/news_news.naver?code={item_.. 더보기
[Seaborn] Distribution Plots 1. Distribution Plots distribution plots는 데이터의 분포를 보기 위한 데이터 시각화 그래프이다. seaborn의 distribution plots는 histplot, kdeplot, ecdfplot, rugplot, displot 다섯가지가 있다. 데이터의 평균, 중위수, 범위, 분산, 편차 등을 이해할 수 있다. 2. Distribution Plots의 그래프 종류 2-1. Hist Plot histplot은 히스토그램으로 변수의 분포를 구간별로 나누어 막대그래프로 나타낸다. 구간은 bins를 이용하여 직접 정할 수 있다. sns.histplot(data=penguins, x="flipper_length_mm", bins=30) hue를 사용하여 변수 하나를 더 추가해 .. 더보기