Bao gồm các chủ đề quan trọng để phát triển kỹ năng và kiến thức trong lĩnh vực khoa học dữ liệu và phân tích dữ liệu.
- Giới thiệu về khoa học dữ liệu và vai trò của nó trong thế giới hiện đại.
- Lý do tại sao khoa học dữ liệu là một lĩnh vực quan trọng.
- Các nguyên tắc cơ bản và các khái niệm quan trọng trong khoa học dữ liệu.
- Ngôn ngữ python
- Ngôn ngữ R
- Hướng dẫn cách trích xuất dữ liệu từ các nguồn khác nhau.
- Xử lý, biến đổi và làm sạch dữ liệu.
- Sử dụng các thư viện như Pandas trong Python để thao tác dữ liệu.
- Phân tích và trực quan hóa dữ liệu bằng các biểu đồ và biểu đồ khác nhau.
- Sử dụng các công cụ như Matplotlib và Seaborn để tạo đồ thị.
- Làm thế nào để trình bày thông tin dữ liệu một cách rõ ràng và hấp dẫn.
- Các khái niệm cơ bản về thống kê, như trung bình, phương sai và độ lệch chuẩn.
- Phân tích phân phối dữ liệu.
- Ứng dụng các phương pháp thống kê trong khoa học dữ liệu.
- Hướng dẫn về mô hình hồi quy và các loại hồi quy khác nhau.
- Sử dụng mô hình hồi quy để dự đoán giá trị.
- Đánh giá hiệu suất của mô hình hồi quy.
- Làm thế nào để xử lý dữ liệu chuỗi thời gian.
- Mô hình hóa và dự đoán xu hướng và mùa vụ trong dữ liệu chuỗi thời gian.
- Sử dụng các thư viện như Time Series Analysis trong Python.
- Giới thiệu về mô hình dữ liệu bảng và ứng dụng của chúng trong khoa học dữ liệu.
- Làm thế nào để xử lý dữ liệu bảng có cấu trúc phức tạp.
- Sử dụng mô hình dữ liệu bảng cho các vấn đề phức tạp.
- Tổng quan về học máy và các thuật toán học máy phổ biến.
- Tiếp cận và giải quyết các vấn đề thực tế bằng học máy.
- Đánh giá hiệu suất của các mô hình học máy.
- Cách triển khai các mô hình học máy vào sản phẩm hoặc ứng dụng thực tế.
- Giới thiệu về các nền tảng triển khai mô hình như AWS, Azure, và Google Cloud.
- Quản lý và duy trì mô hình đã triển khai.
- Cách viết bài báo khoa học và báo cáo dự án trong lĩnh vực khoa học dữ liệu.
- Làm thế nào để trình bày kết quả của dự án khoa học dữ liệu một cách chuyên nghiệp.
- Hướng dẫn về Git và quản lý phiên bản dự án.
- Làm thế nào để làm việc với kho lưu trữ Git và GitHub.
- Quy trình làm việc cộng tác trong nhóm sử dụng Git.
- Giới thiệu về Docker và containerization.
- Tạo và quản lý các container Docker cho các ứng dụng khoa học dữ liệu.
- Triển khai ứng dụng trong các môi trường container Docker.
- Cơ sở dữ liệu và các loại cơ sở dữ liệu khác nhau (SQL, NoSQL, ...)
- Làm thế nào để truy xuất dữ liệu từ cơ sở dữ liệu.
- Sử dụng SQL và các thao tác cơ sở dữ liệu trong khoa học dữ liệu.
- Cách trích xuất dữ liệu từ các trang web bằng web scraping.
- Sử dụng các thư viện như BeautifulSoup và Scrapy trong Python.
- Xử lý dữ liệu trích xuất từ web để sử dụng trong khoa học dữ liệu.
BMLB
├─ 01-Introduction
│ ├─ Index.md
│ └─ README.md
├─ 02-Data Manipulation
│ └─ README.md
├─ 03-Data Visualization
│ └─ README.md
├─ 04-Basic Statistics
│ ├─ README.md
│ └─ statistics.md
├─ 05-Regression
│ ├─ README.md
│ └─ Survival Analysis Basics.Rmd
├─ 06-Timeseries
│ ├─ history_of_timeseries_models.Rmd
│ ├─ holt-winters.Rmd
│ ├─ Multiple_Time_Series_Forecast.Rmd
│ ├─ README.md
│ └─ STL_decomposition.Rmd
├─ 07-Panel Data Models
│ └─ README.md
├─ 08-Machine Learning
│ └─ README.md
├─ 09-Model Deployment
│ └─ README.md
├─ 10-Publication
│ └─ README.md
├─ 11-Git
│ └─ README.md
├─ 12-Docker
│ └─ README.md
├─ 13-Database
│ ├─ README.md
│ └─ README.Rmd
├─ 14-Web Craping
│ └─ README.md
├─ 15-Blogdown
│ └─ blogdown_dev.R
├─ 99-Practice
│ ├─ 2. Scripts
│ │ └─ R
│ │ └─ push_data_to_db.R
│ ├─ Slides
│ │ ├─ css
│ │ │ ├─ nnb.css
│ │ │ ├─ tpb_background.PNG
│ │ │ └─ tpb_title_background.PNG
│ │ └─ xaringanthemer.Rmd
│ ├─ tuning_models_with_workflowsets.Rmd
│ └─ Vitae
│ ├─ mariecurie.jpg
│ ├─ packages.bib
│ ├─ twentysecondcv.cls
│ ├─ Vitae.Rmd
│ └─ Vitae.tex
├─ bml.lectures.Rproj
├─ dev
│ └─ templates
│ ├─ Power point
│ │ └─ facet.pptx
│ └─ Rmd
│ ├─ powerpoint.pptx
│ ├─ powerpoint.Rmd
│ ├─ r-presentation-figure
│ │ └─ unnamed-chunk-2-1.png
│ ├─ r-presentation.md
│ └─ r-presentation.Rpres
├─ images
│ ├─ b_hex.png
│ ├─ faylab-manual-quarto-yml.png
│ ├─ faylab-manual.png
│ ├─ github-action-green.png
│ ├─ github-action-orange.png
│ ├─ github-edit-readme.png
│ ├─ github-source-gh-pages.png
│ ├─ openscapes_hex.png
│ ├─ quarto-files-github.png
│ ├─ quarto-yml-site-side-by-side.png
│ ├─ quarto-yml-site-side-by-side2.png
│ ├─ rstudio-insert-citation-doi.png
│ └─ rstudio-insert-citation.png
├─ include-files.lua
├─ index.qmd
├─ LICENSE
├─ README.html
├─ README.md
├─ _quarto.yml
└─ _site
├─ images
│ ├─ github-action-green.png
│ ├─ github-action-orange.png
│ ├─ github-edit-readme.png
│ ├─ github-source-gh-pages.png
│ ├─ openscapes_hex.png
│ ├─ quarto-files-github.png
│ └─ quarto-yml-site-side-by-side2.png
├─ index.html
├─ learning-more.html
├─ quarto-workflows
│ ├─ browser.html
│ ├─ images
│ │ ├─ github-commit.png
│ │ ├─ github-edit-index.png
│ │ ├─ github-preview-show-diff.png
│ │ ├─ jupyter-execute-cell.png
│ │ ├─ jupyter-python-example.png
│ │ ├─ jupyter-raw-chunk.png
│ │ ├─ jupyter-side-by-side.png
│ │ ├─ quarto-yml-site-side-by-side3.png
│ │ └─ rstudio-orientation.png
│ ├─ index.html
│ ├─ jupyter.html
│ └─ rstudio.html
├─ robots.txt
├─ search.json
├─ sitemap.xml
├─ site_libs
│ ├─ bootstrap
│ │ ├─ bootstrap-dark.min.css
│ │ ├─ bootstrap-icons.css
│ │ ├─ bootstrap-icons.woff
│ │ ├─ bootstrap.min.css
│ │ └─ bootstrap.min.js
│ ├─ clipboard
│ │ └─ clipboard.min.js
│ ├─ quarto-html
│ │ ├─ anchor.min.js
│ │ ├─ popper.min.js
│ │ ├─ quarto-syntax-highlighting-dark.css
│ │ ├─ quarto-syntax-highlighting.css
│ │ ├─ quarto.js
│ │ ├─ tippy.css
│ │ └─ tippy.umd.min.js
│ ├─ quarto-nav
│ │ └─ quarto-nav.js
│ └─ quarto-search
│ ├─ autocomplete.umd.js
│ ├─ fuse.min.js
│ └─ quarto-search.js
└─ transition-from-rmarkdown.html