전체 글

여행, 일상,IT 이야기를 가볍게 풀어갑니다. 잘못된 정보 지적은 항상 감사히 듣겠습니다. 찾아와주셔서 감사드립니다.
짧디 짧은 행복한 시간이 끝나고 이제 현실로 돌아가야할 시간이다 😭조잔케이 유라쿠소안에서 삿포로역으로 이동해 점심을 먹고 공항으로 이동하기로 했다. 삿포로역까지 이동하는 방법으로는 비교적 저렴하지만 편하게 가려고 도난버스를 예약했다.  당일 아침에 이렇게 타야할 버스 이미지와 함께 어디서 타면 되는지 확인 메일을 보내준다. 근데 버스를 타는 위치를 위도, 경도로 찍어서 보내줬는데 지도를 보면 아래처럼 도로 한복판에 찍어놨다. 절대 속으면 안된다. 진짜 버스를 타야하는 곳은 빨간색 화살표로 표시해둔 버스 정류장으로 가야한다.해당 위치로 가면 이렇게 버스 정류장이 있고, 영어로 시라이토노다키라고 적혀있다.  그리고 예약한 시간이 되면 안내 받았던 이미지와 동일한 버스가 와서 픽업해간다.찾아본 바로는 기사님..
겨울 삿포로에서 눈 맞으며 노천탕을 하고 싶은 생각에 뷰도 좋고 시설도 좋아보이는 료칸을 찾다 유라쿠소안을 예약했다. 리뷰를 찾아봤을 땐 셔틀버스를 타고 가면 된다길래 별 걱정 없이 여행 전날까지 멍때리고있다문득 '날마다 예약한 손님이 다를텐데, 사람이 몇명이 올지 알고 예약도 없이 셔틀버스를 운행하지?' 싶어서 찾아보니.. 예약하는게 맞았다.. 이걸 여행 전날 알았고, 당연히 자리가 없었다. 송영버스 말고도 예약할 수 있는 직행 버스들이 있어 찾아보았는데, 전부 매진이었다.. 삿포로역 → 조잔케이 유라쿠소안 가는 방법송영버스 - 무료 셔틀버스. 예약 필수, 숙소 규모에 비해 셔틀이 딱 1대라 예약이 힘듦. 시간대 고정. 약 1시간 소요갓파라이너 - 북해도 관광 안내소 추천 버스. 예약 필수. 금액은 2..
개인적으로 토이 프로젝트를 진행하던 중, 크롤링을 통해 정보를 추출해 메일이나 카톡 알림을 주는 시스템을 만들고 있었다. selenium의 webdriver를 활용해 크롤링을 진행하던 중 발생한 chromedriver 이슈를 공유하려고 한다. Selenium WebDriverExceptionselenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://chromedriver.chromium.org/home webdriver를 사용하면서 chromedriver를 설치하지 않았거나 path를 제대로 지정하지 않는 다면, 위와 같은 에러메세지가 출력되면서 ..
colab 환경에서 jupyter notebook을 활용해 작업을 한 뒤, 해당 ipynb 파일을 보고서나 메일로 제출해야하는 경우가 있다. 이런 상황에 메일이나 보고를 받는 사람이 같은 개발자고 colab이나 vscode를 활용해 ipynb 파일을 읽는데 문제가 없다면 상관없지만, OS, 환경, 휴먼이슈 등의 문제가 발생할 수 있기 때문에 ipynb 파일을 html로 변환하여 공유하는 일이 생각보다 잦다. (엑셀이나 워드를 읽기 전용 파일로 변환하여 보내는 것도 비슷한 이유라고 짐작한다.) 그 중에서도 필자는 로컬 성능 이슈로 colab 환경에서 작업을 자주 하기 때문에 colab 환경에서 google drive와 연동하여 html로 추출하는 방법을 다룬다.코드 # 구글 드라이브 연결from googl..
Selenium의 WebDriver를 사용해 크롤링하기# 추가 패키지 설치!pip install supabase # 수파베이스 SDK 설치!pip install selenium # 헤드리스 브라우저를 위한 테스트 자동화 툴!pip install beautifulsoup4 # html 파싱 툴 크롬 화면 우상단 ... 메뉴 버튼 클릭 → 설정 → 하단 Chrome 정보 클릭크롬 드라이버 다운로드아래 코드로 자신의 운영체제 및 아키텍처 확인https://googlechromelabs.github.io/chrome-for-testing/#stable Chrome for Testing availabilitychrome-headless-shellmac-arm64https://storage.googleapis.co..
에러 내용 해결방법 pip install numpy==1.23.4 or conda install numpy==1.23.4
순 공부시간 하루 5시간(낮2,저3), 5일 공부하고 제 40회 ADsP 데이터분석 준전문가 자격증 시험에 여유로운 점수로 합격했다. 비전공자도, 비전문가도 5일만 신경쓰면 충분히 취득할 수 있는 수준의 난이도이다. 더군다나 단답형이 없어진 지금이야말로 취득하기 적기가 아닐까 싶다. 5일 동안 내가 공부한 방법과 나만의 공부 방법 꿀팁을 공유하려고 한다. 마지막에 적을 나만의 비법도 꼭 참고하길 바란다. 1. 교재 나는 이기적으로 공부했고, 충분히 추천한다. ADsP 교재 추천을 검색하면 민트책 미어캣을 보통 추천하는데, 이미 이 중 보유 중인 교재가 있다면 굳이 더 살 필요는 없다고 생각한다. 만약 산다면 미어캣이나 이기적을 추천한다. 민트책은 있으면 좋지만 없으면 굳이 살 정도로 좋은 교재는 아닌 것..
VSCode 환경에서 JupyterNotebook으로 SpaCy 라이브러리를 사용하여 자연어 처리를 하던 중, 영어 모델인 'en_core_web_sm'을 불러오지 못하는 에러를 만났다. google-colab 환경에서 작업한다면 다음의 코드로 언어 모델을 다운받고 로딩할 수 있다. # Google - colab 환경 # SpaCy 라이브러리 설치 !pip install spacy # 영어 언어 모델 !python -m spacy download en_core_web_sm # 한국어 언어 모델 !python -m spacy download ko_core_news_sm 하지만 난 colab이 너무 불편해서 vscode로 진행하고 싶었고, 그러기 위해선 설정해둔 커널에 언어 모델들을 설치해서 로딩해야했다. ..
세계 각지에 있는 창고를 관리하는 자사 시스템 특성 상 TIME-ZONE과 관련된 이슈를 무시할 수는 없었다. 현재는 국내 창고에서만 사용하고 있었지만 해외 창고 셋업 일정을 내년으로 계획하고 있는 만큼 TIME-ZONE 이슈는 필수 해결과제라고 생각했다. 개발 방식 고려 TIME-ZONE을 관리하는 방법에는 여러가지 방법이 있겠지만, 내부 개발자 회의를 통해 나온 방식은 두 가지였다. 하나는 세계 각지의 시간을 담아서 관리하는 테이블을 만들어 사용자가 입력한 나라에 코드에 맞게 시차를 게산해주는 방식이었고, 다른 하나는 따로 시간을 담아두지 않고 사용자가 개인정보에서 나라를 변경할 때 실시간적인 API통신을 통해 해당 도시의 시간을 받아오자는 것이었다. 전자의 방식 : TIME-ZONE은 불변의 데이터..
본 포스팅에서는 Feature engineering 실습을 위해 1차적으로 가공된 타이타닉 생존자 예측 데이터를 활욯했다. 데이터 로딩 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic = pd.read_csv('data/titanic.csv') titanic.info() 결측치 처리 titanic.isnull().mean() 결측치를 조회해보면 Age, Cabin, Embarked라는 변수에서 결측치가 보인다. 나이는 평균으로 처리해주고, 다른 두 변수는 새로운 범주를 지정해준다. 결측치를 굳이 새로운 범주로 분리하는 가장 큰 이유는 결측치..
xoghks_h
XL-Shine