전체 글 179

[airflow] slack 연결하기-많은 dag에 적용

SlackAPIPostOperator 를 사용하여 slack을 연결하여 실패 메세지 보내기 많은 DAG에 적용하는 방법 -> 모듈 설치하기 pip install apache-airflow-providers-slack pip install apache-airflow-providers-slack -> 모듈 import 하기 from airflow.operators.slack_operator import SlackAPIPostOperator 1. slack에서 작업 slack 가입 후 Token 추가 (OAuth & Permissions 에 있는 토큰을 추가) -> https://jisun-rea.tistory.com/entry/Slack-API-Slack-Bot-%EB%A7%8C%EB%93%A4%EA%B3%..

Infra/MLops 2022.01.10

5분만에 네이버 뉴스 기사 크롤링하기

오픈소스 라이브러리 BeautifulSoup pip install bs4 from bs4 import BeautifulSoup # urllib을 사용한 Request 보내기 import urllib.request url = "https://news.naver.com/" req = urllib.request.urlopen(url) # url에 대한 연결요청 res = req.read() # 연결요청에 대한 응답 soup = BeautifulSoup(res,'html.parser') # BeautifulSoup 객체생성 # print('html 모두 읽어옴 ') # print(soup) test = soup.find_all('strong') print('strong안에 있는 내용 모두 출력') print(t..

Python 2020.07.22

Word2Vec

Word2Vec의 학습 방식 단어 임베딩(embedding) 방법론인 Word2Vec Word2Vec은 말 그대로 단어를 벡터로 바꿔주는 알고리즘입니다. Neural Network Language Model(NNLM)을 계승하면서도 학습 속도와 성능을 비약적으로 끌어올려 주목을 받고 있음. Word2Vec의 Skip-Gram(중심단어로 주변단어 예측) https://ratsgo.github.io/from%20frequency%20to%20semantics/2017/03/30/word2vec/ Word2Vec의 학습 방식 · ratsgo's blog 이번 포스팅에서는 최근 인기를 끌고 있는 단어 임베딩(embedding) 방법론인 Word2Vec에 대해 살펴보고자 합니다. Word2Vec은 말 그대로 단어..

Machine Learning 2020.07.13

Bert

https://hugrypiggykim.com/2018/12/09/bert-pre-training-of-deep-bidirectional-transformers-for-language-understanding/ https://colab.research.google.com/drive/133UHPLf5M5m1qyex3k7PTTRN7vNQQYDp ========================== https://horajjan.blog.me/221423797872 Transformer : 셀프 어텐션으로 구성된 인코더 (RNN, CNN을 사용하지 않고 기존 RNN 으로 구성된 seq2seq의 한계를 넘어서는 성능을 보임 Self-Attention : 단어 간의 연관 관계를 얻을 수 있음. 딥마인드에서 이를 이용하..

Machine Learning 2020.07.13

Confusion Matrix _ PYCM

Confusion Matrix - 머신러닝이 얼마나 잘 예측하는지를 나타내주는 Matrix - 기계 학습 분야의 통계적 분류 같은 문제에서 confusin Matrix란, 지도학습으로 훈련된 분류 알고리즘의 성능을 시각화 할 수 있는 표 - sample code : https://www.kaggle.com/sujinies2/binaryclassification?scriptVersionId=17388277 PyCM: Multiclass confusion matrix library in Python 입력 데이터 벡터와 direct matrix를 모두 지원하는 python으로 작성된 다중 클래스 confusion matrices 라이브러리. 대부분의 클래스 및 전체 통계 매개 변수를 지원하는 사후 분류 모델 ..

Machine Learning 2019.07.18

t-sne

차원축소, 시각화 도구: t - SNE (Stochastic Neighbor Embedding) SNE (Stochastic Neighbor Embedding) 고차원 공간에서 유클리드 거리( Euclidean distance)를 데이터 포인트의 유사성을 표현하는 조건부 확률(conditional probability)로 변환하는 방법 t-SNE 끝단이 퍼지는 다른 분포를 이용 고차원 공간: 가우스 분포 유사도로 변환 저차원 공간: 자유도 1의 분포 유사도로 변환 적당히 떨어진 점을 맵에서 더 멀리 배치 가능 데이터 점과 닮지 않은 점 사이의 인력을 제거 가능 장점 데이터 점 사이의 거리가 큰 것을 유사하지 않은 점으로 모델링 데이터 점 사이의 거리가 작은 것을 유사한 점으로 모델링 Cost ft'n 의..

Machine Learning 2019.07.18

Data Visualization 시작하기

Visualization Tools More Abstraction -----------------------------------> More Control powerBi plotly.js Excel Tableau chartist NVD3 chart.js D3.JS cytoscape.js Data Types Quantitative categorical ordinal temporal spatial Chart Suggestions 데이터분석 과정 문제 정의 > 수집 및 분석할 데이터 정의 > 분석계획/ 표본데이터 수집 > 데이터 획득 > 데이터 전처리 및 정제 > 탐색적 데이터 분석 > 기계학습 등을 이용한 분류 또는 예측 모델링 > 보고서 작성

visualization 2019.04.09
반응형