Ứng dụng Python Siêu dễ: Làm Báo cáo & Phân tích Doanh số Bán hàng với Python, Pandas, và Matplotlib

preview_player
Показать описание
DỮ LIỆU & CODE:

CHƯƠNG TRÌNH TRẢ LỜI CÁC BÀI TOÁN THỰC TẾ CỦA MỘT DOANH NGHIỆP:
- Tháng nào có doanh số tốt nhất? Doanh số tháng đó là bao nhiêu?
- Thành phố nào có doanh số cao nhất?
- Doanh nghiệp cần chiếu quảng cáo vào khung thời gian nào để tăng khả năng mua hàng của khách hàng?
- Những sản phẩm nào thường được bán cùng nhau?
- Sản phẩm nào được bán nhiều nhất? Giả thiết của bạn về lý do sản phẩm này được bán nhiều nhất là gì?

💕 GIÚP KÊNH DUY TRÌ HOẠT ĐỘNG - SIÊU ĐƠN GIẢN!
Donate cho mình tại:
▪️ Momo: 0938605402 - HUYNH TRA DUONG
▪️ Ngân hàng Vietcombank HCM: 0071001053917 - HUYNH TRA DUONG

💕 KẾT NỐI VỚI MÌNH:

💕 ỨNG DỤNG PYTHON VÀO VẤN ĐỀ THỰC TẾ:

TIMESTAMP:
0:17 Giới thiệu Vấn đề
1:14 Demo Chương trình
2:27 Giới thiệu Dữ liệu và Code Editor
3:43 Lên kế hoạch cho chương trình, chia nhỏ vấn đề
4:00 Giới thiệu sự khác biệt giữa Báo cáo dữ liệu và Phân tích dữ liệu
4:36 Task 1: Thiết lập môi trường và Load dữ liệu
4:46 Cài đặt và Import pandas
5:42 Giới thiệu về Dataframe và Series trong pandas
5:59 Tải dữ liệu lên chương trình. Xác định đường dẫn tương đối (relative path) và đường dẫn tuyệt đối (absolute path) đến tập tin
9:03 Task 2: Clean and Preprocess data
9:09 Task 2.1: Tải 12 files dữ liệu lên chương trình. Gộp 12 dataframes lại làm 1
13:11 Task 2.2: Thêm cột "Month" cho dataframes
16:31 Task 2.3: Loại bỏ giá trị "nan" và giá trị "Or"
17:55 Task 3: Reporting & Data Analysis
17:55 Task 3.1: Tháng nào có doanh số tốt nhất? Doanh số tháng đó là bao nhiêu?
22:30 Task 3.2: Thành phố nào có doanh số cao nhất?
27:39 Task 3.3: Doanh nghiệp cần chiếu quảng cáo vào khung thời gian nào để tăng khả năng mua hàng của khách hàng?
31:14 Task 3.4: Những sản phẩm nào thường được bán cùng nhau?
25:18 Task 3.5: Sản phẩm nào được bán nhiều nhất? Giả thiết của bạn về lý do sản phẩm này được bán nhiều nhất là gì?
38:07 Dọn dẹp chương trình và Thêm câu lệnh input ở đầu chương trình để truyền dữ liệu cho lần sử dụng sau

Cảm ơn các bạn rất nhiều~ Chúc các bạn thành công Lập trình Python từ Cơ Bản đến Ứng dụng nher.
Рекомендации по теме
Комментарии
Автор

Hello các bạn, có một số chia sẻ thêm về Câu 2 và Câu 4 từ các bạn trong cộng đồng, mình pin lên đây để cùng học hỏi nhé:

CÂU 4: Cách tiếp cận dùng value_counts của mình là không chính xác vì value_counts chỉ đếm các giá trị duy nhất nên sẽ bỏ sót những order mua từ 2 sản phẩm trở lên.

from itertools import combinations
from collections import Counter

count = Counter()

for products in df_dup['All Products']:
product_list = products.split(", ")
count.update(Counter(combinations(product_list, 2)))

print(count)


CÂU 4: Nếu bạn muốn lấy giá trị ra để vẽ có thể dùng hàm .most_common() lên giá trị count

for key, value in count.most_common(10):
print(key, value)

key sẽ trả về cho tên của hàng, còn value là số lượng


CÂU 2: (Chia sẻ từ bạn @Bao Thai Vuong)
Thay vì phải dùng vòng loop thì chỉ cần thay đòng plt.bar(x = sorted(cities), height = sales_value_city) là sẽ khớp giá trị sale với giá trị city vì khi dùng groupby cho cột City để tính giá trị sales của từng thành phố thì kết quả trả về theo thứ tự bảng chữ cái từ A-Z, nên dùng sorted cho tên thành phố cũng sẽ trả về giá trị theo thứ tự A-Z, tức là nó sẽ khớp với giá trị trả về trong groupby.


CÂU 1:
Nếu bạn muốn in ra luôn tháng có doanh thu lớn nhất thì dùng hàm max() lấy ra giá trị tháng lớn nhất xong lặp qua series để lấy tháng của giá trị lớn nhất ra nhé:

max_value = sales_value.max()
for month, sales in sales_value.items():
if sales == max_value:
print(month, sales)

BoringPPL
Автор

Tuyệt vời. Cách bạn trình bày, giải thích bằng tiếng Anh, minh hoạ bằng hình ảnh rất sinh động. Thao tác trực quan dễ hiểu. Đặc biệt là phong cách clean code, có cả mark-down rất chuyên nghiệp... Thật may mắn khi mình tìm thấy kênh của bạn. Chúc kênh ngày càng phát triển

tuhoclaptrinh
Автор

Timestamp:
0:17 Giới thiệu Vấn đề
1:14 Demo Chương trình
2:27 Giới thiệu Dữ liệu và Code Editor
3:43 Lên kế hoạch cho chương trình, chia nhỏ vấn đề
4:00 Giới thiệu sự khác biệt giữa Báo cáo dữ liệu và Phân tích dữ liệu
4:36 Task 1: Thiết lập môi trường và Load dữ liệu
4:46 Cài đặt và Import pandas
5:42 Giới thiệu về Dataframe và Series trong pandas
5:59 Tải dữ liệu lên chương trình. Xác định đường dẫn tương đối (relative path) và đường dẫn tuyệt đối (absolute path) đến tập tin
9:03 Task 2: Clean and Preprocess data
9:09 Task 2.1: Tải 12 files dữ liệu lên chương trình. Gộp 12 dataframes lại làm 1
13:11 Task 2.2: Thêm cột "Month" cho dataframes
16:31 Task 2.3: Loại bỏ giá trị "nan" và giá trị "Or"
17:55 Task 3: Reporting & Data Analysis
17:55 Task 3.1: Tháng nào có doanh số tốt nhất? Doanh số tháng đó là bao nhiêu?
22:30 Task 3.2: Thành phố nào có doanh số cao nhất?
27:39 Task 3.3: Doanh nghiệp cần chiếu quảng cáo vào khung thời gian nào để tăng khả năng mua hàng của khách hàng?
31:14 Task 3.4: Những sản phẩm nào thường được bán cùng nhau?
25:18 Task 3.5: Sản phẩm nào được bán nhiều nhất? Giả thiết của bạn về lý do sản phẩm này được bán nhiều nhất là gì?
38:07 Dọn dẹp chương trình và Thêm câu lệnh input ở đầu chương trình để truyền dữ liệu cho lần sử dụng sau

BoringPPL
Автор

Cảm thấy choáng ngợp với tốc độ trình bày và sự hiểu biết của bạn, không chỉ trong lập trình mà còn là ngoại ngữ nữa. Mong bạn có thêm nhiều video như thế này nữa. Chúc thành công.

lucnguyentuan
Автор

Hay quá, giọng rất dễ thương mà giải thích cũng rất cuốn, choáng ngợp trước sự thành thạo của bạn, xử lý cả đống vấn đề trong 1 nốt nhạc vậy.!

hungphamvan
Автор

Thật tuyệt vời chị ơi . Em đang học Data Science, những video thực tế như thế này rất bổ ích với ngành IT nói chung và chuyên ngành DS nói riêng ạ . Em rất mong chờ những video thực tế như này từ kênh của chị ạ :333 Cảm ơn chị rất nhiều

ucnguyenminh
Автор

Mong bạn sẽ ra nhiều video về Data Analyst như này hơn
=) Thanks

vantoanofficial
Автор

trong thời buổi big data như vầy mình thấy sắp tới các công ty sẽ không hỏi anh/chị có biết excel tin học văn phòng thì không, mà họ chỉ hỏi bạn có biết pandas không. Thanks bạn vì bài giảng rất chi tiết và hay

quocn
Автор

thật sự tuyệt vời khi cảm nhận được cách chị sử dụng kiến thức, giọng nói, cách biểu đạt để dẫn dắt sự kiên nhân gần như đã mất của bản thân em. thực sự cảm ơn sự đóng góp của chị!

xuanhoanvu
Автор

Cảm ơn bạn rất nhìu, mình mới xem nửa clip thôi là đã muốn ra cảm ơn người giảng rồi ạ!!! Quá là thực tế lun!!

batongsanmienong
Автор

video thực sự hữu ích đối với newbie như e mong c làm nhiều vid hơn về mảng data để m.n có thể học hỏi qua các project như này ! Love <3

huyle-veqi
Автор

Mình mới bắt đầu học python
Xem video này mình biết dc tác dụng lớn của python tạo động lực cho mình cố gắng làm chủ ngôn ngữ này

nguyenminhhung
Автор

nội dung video rất hay và logic từng bước. Mong chị tiếp tục ra nhiều video nữa nhé

nguyenquocbao
Автор

mong bạn ra nhiều nhiều các video kiểu giải case vầy, để mình có thể vừa xem vừa làm theo và học luôn!!!!

kiet
Автор

Video quá hay, bài toán cực kì thực tế. Bạn không chỉ đưa ra đáp án mà còn bày cách cho mọi người google như thế nào. Cực kì hữu dụng. Mong bạn ra thêm nhiều video nữa như vậy

CuteCubeLG
Автор

Chị hướng dẫn không giống hướng dấn dân IT rồi (do dân IT toàn phải tự tìm hiểu cách search cũng như cú pháp lệnh) nhưng cực xịn xò luôn, rất có tâm!!!!

SangNguyen-dtju
Автор

Các video chất lượng quá, hi vọng có thêm nhiều bài giản thú vị hơn nữa ạ

zzzx
Автор

ôi dời rất hữu ích luôn bạn ơi, mình là dân trái ngành, thỉnh thoảng lạc lối lắm, may mà có bạn chia sẽ thêm kiếm thức

myhoa
Автор

Coi video quá hay, không bỏ 1 giây nào. Cảm ơn video cực kỳ bổ ích. Hy vọng bạn ra thêm nhiều video để cộng đồng có thể học hỏi được nhiều hơn

tienok
Автор

Rất thích cách làm video và trình bày của bạn này, rất chỉn chu và dễ hiểu

cgpmth