검색결과 리스트
크롤링에 해당되는 글 4건
- 2020.06.05 웹크롤링으로 관리종목, 거래중지 종목 구하기
- 2020.05.24 [파이썬] Dart 공시정보 API를 이용한 실시간 공시정보 활용 2
- 2020.05.23 웹크롤링 네이버 주식 상장기업 주가
- 2020.05.23 웹크롤링 네이버 주식 오늘의 상승종목
글
웹크롤링으로 관리종목, 거래중지 종목 구하기
자동 매매를 하게 되면 사지 말아야 할 주식이 있습니다. 예를들어 관리종목이라든가 본인이 싫어하는 종목 등등이 있겠죠. 혹시라도 매매할 대상으로 이런 종목이 선정이 되면 무시하는 부분을 추가하여야 합니다. 추가로 거래량이 별로 없는 종목들도 빼야합니다. 그래서 자동 매매를 할 때는 개인적으로 빼야할 종목 기록한 파일을 하나 더 사용을 합니다.
네이버 주식에서 관리종목, 거래중지 종목을 검색할 수 있습니다.
우선 관리종목과 거래정지 종목은 아래 링크로 검색할 수 있습니다.
- 관리종목 : https://finance.naver.com/sise/management.nhn
- 거래중지 : https://finance.naver.com/sise/trading_halt.nhn
위 두 링크에서 검색이 되는 종목을 뽑아보겠습니다.
주어진 url에서 BeautifulSoup을 이용하여 html 구조를 얻는다.
html 구조에 \tr로 시작하는 부분을 검색한 후
\th 부분에 있는 title 이름을 얻는다.
html 구조에 \td에 있는 주식 정보를 얻는다.
정보 중 종목명을 찾은 후 이에 해당하는 code를 찾아서 list에 보관
파일에 결과를 json 형태와 csv 형태로 저장한다.
전체 소스코드는 아래 깃허브에 있습니다.
https://github.com/multizone-quant/system-trading/blob/master/get_warning_stock_list
'시스템트레이딩' 카테고리의 다른 글
[시스템트레이딩] 전략 시뮬레이션(1) (2) | 2020.11.16 |
---|---|
차트 그릴 때 진입 위치를 표시하는 방법 (2) | 2020.07.22 |
[파이썬] 요일 찾기에서 주말 건너뛰기 (0) | 2020.05.30 |
[파이썬] Dart 공시정보 API를 이용한 실시간 공시정보 활용 (2) | 2020.05.24 |
웹크롤링 네이버 주식 상장기업 주가 (0) | 2020.05.23 |
글
[파이썬] Dart 공시정보 API를 이용한 실시간 공시정보 활용
공시정보는 Dart에서 확인이 가능합니다.
기업에 대한 다양한 정보가 올라오기 때문에 이를 활용하여 투자에 이용하는 경우가 많습니다. 특히 대주주 변동이 공시에 뜨면 주가가 급변하는 경우가 많습니다. 대주주 지분 증가, 신규 대주주 지분 취득 등의 공시가 나오면 자동으로 매수를 하는 전략을 사용할 수 있습니다.
이를 위하여 Dart에서 공시 정보를 실시간으로 읽어오는 파이썬 프로그램을 만들어 보겠습니다.
웹크롤링을 이용하여 공시 정보를 받아올 수 있지만, Dart에서 제공하는 Open API를 이용하는 것이 좋을 것 같습니다.
Dart Open API를 이용하기 위해서는 회원 가입을 한 후 인증키를 신청하여 받은 후 사용이 가능합니다.
인증키를 받은 후 특정기업의 대주주 지분 변경 사항을 받아올 수 있는 파이썬 코드입니다.
우선 이를 위한 url을 확인해보겠습니다. 개발 가이드를 클릭한 후 왼쪽에 있는 정보 중 원하는 것을 선택하면 제공하는 정보 목록이 나옵니다. 이 중 원하는 API가 있는 경우에 오른쪽에 있는 바로가기를 누르면 url 예제가 나옵니다.
예를들어 지난 주 지분변경 정보를 위한 url은 다음과 같습니다.
이러한 정보를 바탕으로 지분 변경 공시 사항을 확인할 수 있는 파이썬 코드는 다음과 같습니다.
사용법은 다음과 같습니다.
~~~
res = find_major_holder_change_all('D', '20200518', '20200522') # type, begin, end
print('')
~~~
지분 변경 공시 중 주가에 영향을 미칠만한 사항이 있는 경우에 매수 혹은 매도 주문이 가능할 것 같습니다. 매수한 후 언제 팔지에 대한 전략도 만들어야겠지요?
파이썬 소스코드는 아래 github에 있습니다.
https://github.com/multizone-quant/system-trading/blob/master/share_holder_info_DART.py
'시스템트레이딩' 카테고리의 다른 글
차트 그릴 때 진입 위치를 표시하는 방법 (2) | 2020.07.22 |
---|---|
웹크롤링으로 관리종목, 거래중지 종목 구하기 (0) | 2020.06.05 |
[파이썬] 요일 찾기에서 주말 건너뛰기 (0) | 2020.05.30 |
웹크롤링 네이버 주식 상장기업 주가 (0) | 2020.05.23 |
웹크롤링 네이버 주식 오늘의 상승종목 (0) | 2020.05.23 |
글
웹크롤링 네이버 주식 상장기업 주가
지난 번에 올린 상승 종목에 이어 전략을 적용하려면 증시에 상장된 모든 종목의 일봉 정보도 필요합니다. 이 정보 역시 naver에서 가져올 수 있습니다.
아래 그림에서 보듯이 네이버에서 가져올 수 있는 정보가 다양합니다만, 한 시점에 6항목을 고를 수 있습니다. default로 설정되어 있는 값은 본인이 원하는 값과 틀린 경우에는 필요한 정보를 선택을 하여야 합니다.
이렇게 웹 페이지에서 원하는 항목을 선택하기 위해서는 webdriver를 설치하여 페이지를 그려야합니다. 브라우저에 따라 webdriver가 있는데 아래는 chrom driver를 사용한 예입니다. chrom driver를 인터넷에서 찾아서 down받은 후 저장된 위치를 지정하여 사용하면 됩니다.
크롬웹드라이버에서 웹 페이지를 읽은 후 원하는 항목을 선택하는 방식을 이용하면 됩니다. 우선 원하는 url을 지정하여 화면에 뜨는 상태를 확인합니다.
우리가 필요한 것은 오늘 일봉 정보가 필요합니다. 즉 시가/고가/저가가 필요합니다. 이를 위하여 필요한 항목을 찾아서 click() 함수를 호출하고, 불필요한 항목을 찾아서 click()함수를 호출하면 원하는 항목으로 변경이 가능합니다.
driver = webdriver.Chrome("C:\\my\\chromedriver.exe")
url = https://finance.naver.com/sise/sise_market_sum.nhn?sosok=1'
driver.get(url)
driver.find_element_by_xpath(".//*[contains(text(), '고가')]").click()
driver.find_element_by_id("option7").click() # 시가
driver.find_element_by_xpath(".//*[contains(text(), '저가')]").click()
driver.find_element_by_xpath(".//*[contains(text(), '외국인비율')]").click() # 삭제
driver.find_element_by_xpath(".//*[contains(text(), '상장주식수')]").click() # 삭제
driver.find_element_by_xpath(".//*[contains(text(), 'ROE')]").click() # 삭제
driver.find_element_by_css_selector('[alt="적용하기"]').click()
이렇게 설정을 하면 아래와 같이 원하는 항목만 선택이 가능합니다.
코스피와 코스닥 정보를 얻을 수 있는 url은 다음과 같습니다.
- 코스피 : https://finance.naver.com/sise/sise_market_sum.nhnsosok=0
- 코스닥 : https://finance.naver.com/sise/sise_market_sum.nhn?sosok=1
한 화면에 보이는 종목의 수는 최대 50개이므로 페이지를 계속 변경해가면서 정보를 크롤링해야합니다.
url에 페이지 정보를 추가할 수 있습니다. page 번호를 증가시키면서 검색을 계속하면 됩니다.
https://finance.naver.com/sise/sise_market_sum.nhn?sosok=1&page=2
이러한 정보를 바탕으로 코스피, 코스닥 전 종목 일봉을 받아오는 크롤링 프로그램을 만들어보겠습니다.
우선 코스피, 코스닥 기본 url을 지정을 합니다. 현재 네이버에서 검색이 가능한 코스피,코스닥 각각의 최대 page 수를 지정합니다. 이후에는 loop를 돌면서 page 수를 증가시키면서 해당 page의 시세 정보를 가져오는 get_stock_list()를 부릅니다.
아래 함수는 특정 url에 있는 주식 시세 정보를 뽑아내는 함수입니다. (자세한 사항은 github 코드 참고)
~~~
def get_stock_list(url, cnt) :
~~~
네이버에서는 최대 6개까지 검색할 항목을 지정할 수 있는데요. 꼭 필요한 정보만 설정을 했습니다. 만약 다른 정보가 추가로 필요하다면 설정을 바꾼 후 한번 더 호출하면 될 것 같습니다.
해당 페이지에서 주식 시세를 뽑는 방법은 이전 글에서 설명한 상승종목 뽑는 방식과 동일합니다. 다만 첫 컬럼에 있는 no 값이 1부터 시작하는 것이 아니라 페이지 별로 50씩 증가하는 값을 입력을 받아서 사용하는 부분만 차이가 납니다.
이렇게 뽑혀진 주식 시세는 별도 파일에 저장하여 향후에 다시 사용합니다. 저장하는 방법은 json 형태로 해도 되고, cvs 형태로 할 수도 있습니다.
소스코드는 git hub에 올려 놓았습니다.
github.com/multizone-quant/system-trading/blob/master/day-bong-list-soup.py
'시스템트레이딩' 카테고리의 다른 글
차트 그릴 때 진입 위치를 표시하는 방법 (2) | 2020.07.22 |
---|---|
웹크롤링으로 관리종목, 거래중지 종목 구하기 (0) | 2020.06.05 |
[파이썬] 요일 찾기에서 주말 건너뛰기 (0) | 2020.05.30 |
[파이썬] Dart 공시정보 API를 이용한 실시간 공시정보 활용 (2) | 2020.05.24 |
웹크롤링 네이버 주식 오늘의 상승종목 (0) | 2020.05.23 |
글
웹크롤링 네이버 주식 오늘의 상승종목
시스템 트레이딩을 위하여 필요한 정보를 모아보도록 하겠습니다.
이번에 개발할 로직은 코스닥에서 상승 추세 종목 찾아서 매매하기입니다.
이를 위하여 오늘 상승한 종목을 구해야합니다.
이베스트 xing api에서는 전 종목 일봉 데이터를 얻을 수는 있지만 시간이 많이 걸린다고 합니다.
네이버에 있는 주식 관련 정보 중 상승종목을 보여주는 페이지가 있습니다. 제가 필요한 정보가 바로 이겁니다.
화면에 보여주는 정보는 최대 7개를 설정할 수 있습니다. 제가 설정한 정보는 거래량,시가,고가,저가,시가총액,per,poe 입니다. 이를 바탕으로 코딩을 했습니다. 혹시라도 다른 정보가 필요하다면 필요한 항목을 선택하시고, 아래 title_list의 내용도 함께 변경하시기 바랍니다.
~~~
title_list = ['no', 'name', 'close', 'diff', 'per', 'qty', 'open', 'high', 'low', 'sichong', 'per', 'pbr']
~~~
이제 이 정보를 크롤링을 해서 파일에 저장한 후 사용을 하면 되겠죠. 오랜만에 크롤링을 해 봅니다.
특정 페이지를 크롤링을 하기 위해서는 크롬에서 개발자모드로 들어가서 해당 페이지의 html 구조를 파악해야 합니다. 다행히 이 페이지는 table 형태로 구성이 되어 있어서 크롤링하는데 문제가 없습니다.
오랜만에 사용하는 package라 구글링으로 사용법을 찾아보면서 코딩을 했습니다.
urllib로 해당 페이지 내용을 읽어오고, BeautifulSoup으로 html 문서 파싱을 하면 됩니다.
화면에 보이는 그대로 html 문서가 구성되어 있기 때문에 중간에 공백도 있고 줄도 있습니다. 이런 부분들은 제거하고 주식 정보만 뽑는 코드는 다음과 같습니다.
첫 글짜가 숫자인 경우에 한하여 일련번호를 증가시키면서 해당하는 종목 정보를 저장합니다. 첫 글짜가 숫자가 아닌 경우에는 except가 발생합니다. 이런 경우에는 그냥 무시하시면 됩니다.
그리고 크롤링한 결과 날짜별로 이름을 붙여서 저장하는 것으로 마무리합니다.
장이 끝나면 이 프로그램 한번 돌려서 오늘 상승한 종목을 저장해 놓은 후 다음 날 장 시작하기전에 투자 검토 대상을 뽑은 후 조건을 만족하면 자동 매수를 하면 될 것 같습니다.
해당 코드는 아래 github에 올려놓았습니다.
https://github.com/multizone-quant/system-trading/blob/master/ascending-stock-list.py
'시스템트레이딩' 카테고리의 다른 글
차트 그릴 때 진입 위치를 표시하는 방법 (2) | 2020.07.22 |
---|---|
웹크롤링으로 관리종목, 거래중지 종목 구하기 (0) | 2020.06.05 |
[파이썬] 요일 찾기에서 주말 건너뛰기 (0) | 2020.05.30 |
[파이썬] Dart 공시정보 API를 이용한 실시간 공시정보 활용 (2) | 2020.05.24 |
웹크롤링 네이버 주식 상장기업 주가 (0) | 2020.05.23 |