[Alteryx] Alteryx 소개 및 기초적인 사용법(Input, Select, Output)Alteryx란? Alteryx는 직관적인 UI와 Drag&Drop 방식의 워크플로우를 통해 간편하게 작업할 수 있는 데이터 분석 및 ETL 툴이다. 코딩 없이 데이터를 분석, 처리, 변환 할 수 있게 도와주는 툴이지만 기본xl-shine.tistory.comBrowse Tool Palette의 In/Out tab에 위치해있다. Browse Tool을 원하는 위치에 Drag&Drop하여 데이터를 연결해주고 실행하면 좌측 Configuration 영역에서 데이터 통계를 시각적으로 확인하고 분석할 수 있다. Workflow 중간 단계에서 데이터가 올바르게 변환되었는지 확인하거나 처리 완료된 데이터를 시각적으로 확..
Alteryx란? Alteryx는 직관적인 UI와 Drag&Drop 방식의 워크플로우를 통해 간편하게 작업할 수 있는 데이터 분석 및 ETL 툴이다. 코딩 없이 데이터를 분석, 처리, 변환 할 수 있게 도와주는 툴이지만 기본적인 SQL 지식이 있어야 워크플로우를 이해하기 쉽고, 활용성 측면에서도 SQL 로직 구현 유무에 따라 Output의 품질이 달라진다. 또한, 무료 툴이 아니다보니 개인적으로 사용할 때는 비용적인 측면에서 부담이 될 수 있다. 화면 구성Tool Palette - 영역에 있는 Tool들을 Canvas 영역에 Drag&Drop하여 Workflow를 작성할 수 있다.Canvas - Tool들을 연결해 Workflow를 설계, 작업하고, 데이터 흐름을 시각적으로 구성할 수 있다.Configu..
짧디 짧은 행복한 시간이 끝나고 이제 현실로 돌아가야할 시간이다 😭조잔케이 유라쿠소안에서 삿포로역으로 이동해 점심을 먹고 공항으로 이동하기로 했다. 삿포로역까지 이동하는 방법으로는 비교적 저렴하지만 편하게 가려고 도난버스를 예약했다. 당일 아침에 이렇게 타야할 버스 이미지와 함께 어디서 타면 되는지 확인 메일을 보내준다. 근데 버스를 타는 위치를 위도, 경도로 찍어서 보내줬는데 지도를 보면 아래처럼 도로 한복판에 찍어놨다. 절대 속으면 안된다. 진짜 버스를 타야하는 곳은 빨간색 화살표로 표시해둔 버스 정류장으로 가야한다.해당 위치로 가면 이렇게 버스 정류장이 있고, 영어로 시라이토노다키라고 적혀있다. 그리고 예약한 시간이 되면 안내 받았던 이미지와 동일한 버스가 와서 픽업해간다.찾아본 바로는 기사님..
겨울 삿포로에서 눈 맞으며 노천탕을 하고 싶은 생각에 뷰도 좋고 시설도 좋아보이는 료칸을 찾다 유라쿠소안을 예약했다. 리뷰를 찾아봤을 땐 셔틀버스를 타고 가면 된다길래 별 걱정 없이 여행 전날까지 멍때리고있다문득 '날마다 예약한 손님이 다를텐데, 사람이 몇명이 올지 알고 예약도 없이 셔틀버스를 운행하지?' 싶어서 찾아보니.. 예약하는게 맞았다.. 이걸 여행 전날 알았고, 당연히 자리가 없었다. 송영버스 말고도 예약할 수 있는 직행 버스들이 있어 찾아보았는데, 전부 매진이었다.. 삿포로역 → 조잔케이 유라쿠소안 가는 방법송영버스 - 무료 셔틀버스. 예약 필수, 숙소 규모에 비해 셔틀이 딱 1대라 예약이 힘듦. 시간대 고정. 약 1시간 소요갓파라이너 - 북해도 관광 안내소 추천 버스. 예약 필수. 금액은 2..
개인적으로 토이 프로젝트를 진행하던 중, 크롤링을 통해 정보를 추출해 메일이나 카톡 알림을 주는 시스템을 만들고 있었다. selenium의 webdriver를 활용해 크롤링을 진행하던 중 발생한 chromedriver 이슈를 공유하려고 한다. Selenium WebDriverExceptionselenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://chromedriver.chromium.org/home webdriver를 사용하면서 chromedriver를 설치하지 않았거나 path를 제대로 지정하지 않는 다면, 위와 같은 에러메세지가 출력되면서 ..
colab 환경에서 jupyter notebook을 활용해 작업을 한 뒤, 해당 ipynb 파일을 보고서나 메일로 제출해야하는 경우가 있다. 이런 상황에 메일이나 보고를 받는 사람이 같은 개발자고 colab이나 vscode를 활용해 ipynb 파일을 읽는데 문제가 없다면 상관없지만, OS, 환경, 휴먼이슈 등의 문제가 발생할 수 있기 때문에 ipynb 파일을 html로 변환하여 공유하는 일이 생각보다 잦다. (엑셀이나 워드를 읽기 전용 파일로 변환하여 보내는 것도 비슷한 이유라고 짐작한다.) 그 중에서도 필자는 로컬 성능 이슈로 colab 환경에서 작업을 자주 하기 때문에 colab 환경에서 google drive와 연동하여 html로 추출하는 방법을 다룬다.코드 # 구글 드라이브 연결from googl..
Selenium의 WebDriver를 사용해 크롤링하기# 추가 패키지 설치!pip install supabase # 수파베이스 SDK 설치!pip install selenium # 헤드리스 브라우저를 위한 테스트 자동화 툴!pip install beautifulsoup4 # html 파싱 툴 크롬 화면 우상단 ... 메뉴 버튼 클릭 → 설정 → 하단 Chrome 정보 클릭크롬 드라이버 다운로드아래 코드로 자신의 운영체제 및 아키텍처 확인https://googlechromelabs.github.io/chrome-for-testing/#stable Chrome for Testing availabilitychrome-headless-shellmac-arm64https://storage.googleapis.co..
에러 내용 해결방법pip install numpy==1.23.4orconda install numpy==1.23.4
순 공부시간 하루 5시간(낮2,저3), 5일 공부하고 제 40회 ADsP 데이터분석 준전문가 자격증 시험에 여유로운 점수로 합격했다. 비전공자도, 비전문가도 5일만 신경쓰면 충분히 취득할 수 있는 수준의 난이도이다. 더군다나 단답형이 없어진 지금이야말로 취득하기 적기가 아닐까 싶다. 5일 동안 내가 공부한 방법과 나만의 공부 방법 꿀팁을 공유하려고 한다. 마지막에 적을 나만의 비법도 꼭 참고하길 바란다. 1. 교재 나는 이기적으로 공부했고, 충분히 추천한다. ADsP 교재 추천을 검색하면 민트책 미어캣을 보통 추천하는데, 이미 이 중 보유 중인 교재가 있다면 굳이 더 살 필요는 없다고 생각한다. 만약 산다면 미어캣이나 이기적을 추천한다. 민트책은 있으면 좋지만 없으면 굳이 살 정도로 좋은 교재는 아닌 것..
VSCode 환경에서 JupyterNotebook으로 SpaCy 라이브러리를 사용하여 자연어 처리를 하던 중, 영어 모델인 'en_core_web_sm'을 불러오지 못하는 에러를 만났다. google-colab 환경에서 작업한다면 다음의 코드로 언어 모델을 다운받고 로딩할 수 있다.# Google - colab 환경# SpaCy 라이브러리 설치!pip install spacy# 영어 언어 모델!python -m spacy download en_core_web_sm# 한국어 언어 모델!python -m spacy download ko_core_news_sm 하지만 난 colab이 너무 불편해서 vscode로 진행하고 싶었고, 그러기 위해선 설정해둔 커널에 언어 모델들을 설치해서 로딩해야했다.'how to..