파이썬과 주식/파이썬으로 주식하기

[파이썬 주식 분석] 1. 파이썬으로 주식 상장 목록 받아오기

by seokii 2022. 3. 22.
728x90
반응형

주식 상장 기업 공식 홈페이지

https://kind.krx.co.kr/

 

대한민국 대표 기업공시채널 KIND

 

kind.krx.co.kr

주식 상장 기업들의 다양한 정보들을 제공하는 사이트입니다.

사이트를 통해 당일 공시, 시장조치, 채권정보 등 다양한 정보를 간편하게 확인할 수 있습니다.

 

기업 상장 정보

상장된 기업의 목록은 다음과 같은 순서로 확인할 수 있습니다.

- 홈페이지에서 상장법인 상세정보 버튼을 클릭합니다.

 

- 위의 사진과 같이 상장법인목록을 누르고 검색 버튼 옆 엑셀 버튼을 누르면 엑셀 파일로 다운로드 가능합니다.

 

- 위의 사진은 해당 내용을 다운로드 받아 파일을 연 모습입니다.

 

주피터 노트북으로 실습하기

In [1] : 

import pandas as pd

- 상장 목록을 받아오기 위해서 판다스 라이브러리를 사용하도록 하겠습니다.

- 판다스(Pandas)는 데이터 조작 및 분석을 위한 파이썬 언어 기반의 라이브러리 입니다. 특히, 숫자 테이블과 시계열을 조작하기 위한 데이터 구조와 연산을 제공합니다.

 

In [2] : 

df = pd.read_html('https://kind.krx.co.kr/corpgeneral/corpList.do?method=download&searchType=13')[0]

- 판다스의 .read_html() 함수를 사용해 해당 주소의 파일을 읽어옵니다.

- 상장법인목록의 확장자는 .xls이지만, 내용이 <tr>, <td> 태그 등으로 이루어진 HTML입니다.

따라서, .read_excel()이 아닌 .read_html()을 사용해야 합니다.

- 직접 파일을 다운로드 받아 다운받은 파일의 경로를 입력하여도 똑같은 기능을 수행합니다.

 

In [3] : 

df.head()

- .head() 함수를 통해 데이터프레임의 상위 5개의 행을 시각적으로 확인할 수 있습니다.

- 자세히보면, 주식에서 중요한 6자리의 종목코드가 앞 자리 0이 모두 사라져 이에 대한 처리가 필요합니다.

 

In [4] : 

df['종목코드'] = df['종목코드'].map('{:06d}'.format)
df = df.sort_values(by='종목코드')
df.head()

- map() 함수와 format() 함수를 사용해 숫자 형식에 대한 처리를 진행합니다.

- .sort_values() 함수를 사용해 종목코드를 기준으로 오름차순 정렬을 진행합니다.

- 처리 결과 앞 자리 0이 잘 나타나며, 오름차순으로 정렬된 것을 확인할 수 있습니다.

 

상장 목록을 불러왔으니, 다음 포스팅에서는 원하는 종목의 일별 시세를 구하는 실습을 해보도록 하겠습니다.

 

 

728x90
반응형

댓글