Skip to content

A Various Data Sets for Data Science, Machine Learning, and Artificial Intelligence

License

Notifications You must be signed in to change notification settings

hephaex/DataSets

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

85 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DataSets

A various data sets for Machine Learning, Artificial Intelligence, and Data Science. Maintained by Community: https://www.Neuromancer.kr/

Machine Learning Data

  • Pix2Pix

한국거래소(KRX)에서 일자별 시가총액 순위 데이터

1995-05-02~2019-04-30 (24년간), 1천만건 (CSV) https://github.com/FinanceData/marcap.git

Pix2Pix

geo

兵庫県_全域数値地形図_ポータル(2010年度~2018年度)https://www.geospatial.jp/ckan/dataset/2010-2018-hyogo-geo-potal

Image

refer from https://github.com/rudvlf0413/Dataset.git

TTS

Dataset: http://www.openslr.org/60/

Youtube

  • https://research.google.com/youtube8m/index.html?fbclid=IwAR3JtSscHE1npIsYNwLpJtnSN_Oym_zO6TJTMSoVPv6u6FogzjunKVisyHI
    • Google AI 에서 기존에 알려진 YouTube-8M의 일부를 확장하여, segment level의 annotation이 제공되는 데이터셋
    • 기존의 YouTube-8M에서는 비디오/프레임 level의 머신이 생성한 레이블을 제공한 반면, 이번에는 segment level의 사람이 매뉴얼로 검증한 레이블이 제공
    • 1,000개의 클래스에 대하여,
    • 237K 개의 레이블 (사람이 매뉴얼하게)
    • 하나의 비디오당 평균 5개의 segments
    • 하나의 segment당, 비디오에서 무작위로 추출된 5초 구
    • annotation 포맷은 기존의 YouTube-8M과 유사합니다. (segment의 시작과 끝, 그리고 각 segment당 레이블 정보)

Classification or Recognition or Generative

Medical

Video

Text

Nerural Network Translation

Categorical & Topic modeling

Short text

QA

Word Embedding

Sentiment Analysis

Sound

Knowledge Base

Social Networks & Recomendationdation

Pre-trained Model

국내 데이터셋

ETC.

Data Science Data

  • Diamond.csv
  • countries.csv
  • exprs_GSE5859.csv
  • movies.dat
  • movie_lines.txt
  • movie conversation
  • mtcars.csv
  • pollster_cleaned_2002_2008.csv
  • pollster_cleaned_2010.csv
  • pollster_cleaned_2012.csv
  • kospi_kospi.csv

About

A Various Data Sets for Data Science, Machine Learning, and Artificial Intelligence

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published