用Python制作销售数据可视化看板,展示分析一步到位

前言

在数据时代,销售数据分析的重要性不言而喻。

[En]

In the data age, the importance of sales data analysis is needless to say.

只有对销售数据进行准确的分析,才能找出数据变化(增长或下降)的原因。

[En]

Only with an accurate analysis of the sales data can we find out the reasons for the changes (growth or decline) of the data.

这样才有可能解决问题,找到新的增长点。

[En]

Then it will be possible to solve problems and find new growth points.

今天就给大家介绍一个用Python制作销售数据大屏的方法。

主要使用Python的Streamlit库、Plotly库、Pandas库进行搭建。

其中Pandas处理数据,Plotly制作可视化图表,Streamlit搭建可视化页面。

对于以上三个库,Streamlit库可能大家会比较陌生,我简单介绍一下。

Streamlit是一个完全免费的开源应用程序框架,它能帮你不用懂得复杂的HTML,CSS等前端技术就能

快速做出来一个炫酷的Web页面。

; 标题文档地址

https://docs.streamlit.io/

具体地说,我们可以看看文件来学习,多动手练习。

[En]

Specifically, we can look at the documents to learn, more hands-on practice.

接下来,让我们解释如何构建销售数据看板。

[En]

Next, let’s explain how to build sales data Kanban.

01. 数据

所用数据为虚构数据,某超市2021个销售订单数据,共计1000个订单数据。

[En]

The data used is fictional data, a supermarket 2021 sales order data, a total of 1000 order data.

有三个城市,北京、上海和杭州。有两种类型的客户,会员和普通。顾客性别为男性和女性。

[En]

There are three cities, Beijing, Shanghai and Hangzhou. There are two types of customers, member and ordinary. The customer sex is male and female.

其余内容还包括订单号、产品类型、单价、数量、总价、日期、时间、付款方式、成本、毛利、总收入、分数等信息。

[En]

The rest also contains information such as order number, product type, unit price, quantity, total price, date, time, payment method, cost, gross margin, total income, score and so on.

通用Pandas的read_excel方法读取数据。

跳过前3行,选取B到R列,1000行数据。

用Python制作销售数据可视化看板,展示分析一步到位
python学习交流Q群:906715085###
def get_data_from_excel():
    df = pd.read_excel(
        io="supermarkt_sales.xlsx",
        engine="openpyxl",
        sheet_name="Sales",
        skiprows=3,
        usecols="B:R",
        nrows=1000,
    )
    # 添加小时列数据
    df["小时"] = pd.to_datetime(df["时间"], format="%H:%M:%S").dt.hour
    return df

df = get_data_from_excel()
print(df)

数据读取成功,结果如下。

[En]

The data was read successfully, and the result is as follows.

现在您可以编写页面了。

[En]

Now you can write the page.

02. 网页标题和图标

我们都知道,当浏览器打开一个网页时,它会有一个标题和图标。

[En]

We all know that when a browser opens a web page, it will have a title and icon.

所以我们首先需要设置这个页面的名称、图标、布局等。

[En]

So we need to set the name, icon, layout and so on of this page first.

这也是使用Streamlit搭建页面,使用的第一个Streamlit命令,并且只能设置一次。

设置网页信息
st.set_page_config(page_title="销售数据大屏", page_icon=":bar_chart:", layout="wide")

其中page_icon参数可以使用表情符号代码来显示图标。

以下链接提供了简短的代码。

[En]

The short code is available from the link below.

https://www.webfx.com/tools/emoji-cheat-sheet/

一个完整的集合正确的表情符号代码!

[En]

A complete collection of proper emoji codes!

03. 侧边栏和多选框

st.sidebar(侧边栏),每个传递给st.sidebar的元素都会被固定在左边,让用户可以专注于主页中的内容。

multiselect(多选框)是一个交互性的部件,可以通过它进行数据筛选。

python学习交流Q群:906715085####
侧边栏
st.sidebar.header("请在这里筛选:")
city = st.sidebar.multiselect(
    "选择城市:",
    options=df["城市"].unique(),
    default=df["城市"].unique()
)

customer_type = st.sidebar.multiselect(
    "选择顾客类型:",
    options=df["顾客类型"].unique(),
    default=df["顾客类型"].unique(),
)

gender = st.sidebar.multiselect(
    "选择性别:",
    options=df["性别"].unique(),
    default=df["性别"].unique()
)

df_selection = df.query(
    "城市 == @city & 顾客类型 ==@customer_type & 性别 == @gender"
)

结合Pandas的query查询,就能对数据进行过滤。

通过上面的代码成功构建,如下图左侧所示。

[En]

It is successfully built through the above code, as shown on the left side of the figure below.

点击侧边栏右上角关闭该符号,即可隐藏侧边栏。

[En]

Click on the upper right corner of the sidebar to close the symbol, and the sidebar can be hidden.

网页将会展示主页面。

04. 主页面信息

然后写出主页信息,包括首页标题、总销售额、平均分、平均销售额信息。

[En]

Then write the main page information, including the home page title, total sales, average score, average sales information.

就像网页上的图标一样,它是通过表情符号代码实现的。

[En]

Like the icons on the web page, it is implemented through emoji code.

主页面
st.title(":bar_chart: 销售数据大屏")
st.markdown("##")

核心指标, 销售总额、平均评分、星级、平均销售额数据
total_sales = int(df_selection["总价"].sum())
average_rating = round(df_selection["评分"].mean(), 1)
star_rating = ":star:" * int(round(average_rating, 0))
average_sale_by_transaction = round(df_selection["总价"].mean(), 2)

3列布局
left_column, middle_column, right_column = st.columns(3)

添加相关信息
with left_column:
    st.subheader("销售总额:")
    st.subheader(f"RMB {total_sales:,}")
with middle_column:
    st.subheader("平均评分:")
    st.subheader(f"{average_rating} {star_rating}")
with right_column:
    st.subheader("平均销售额:")
    st.subheader(f"RMB {average_sale_by_transaction}")

分隔符
st.markdown("""---""")

完成对核心指标数据的处理,并进行布局展示。

[En]

Complete the processing of the core index data, and display it in layout.

05. 主页面图表

包含了两个图表,一个是每小时销售额,一个是各类商品销售总额。通过Plotly Express完成图表的绘制。

Plotly Express是一个新的高级Python可视化库,是Plotly.py的高级封装,它为复杂的图表提供了一个简单的语法。

文档地址

https://plot.ly/python/plotly-express/

受Seaborn和ggplot2的启发,它专门设计为具有简洁,一致且易于学习的API。只需一次导入,就可以在一个函数调用中创建丰富

的交互式绘图。

python学习交流Q群:906715085###
各类商品销售情况(柱状图)
sales_by_product_line = (
    df_selection.groupby(by=["商品类型"]).sum()[["总价"]].sort_values(by="总价")
)
fig_product_sales = px.bar(
    sales_by_product_line,
    x="总价",
    y=sales_by_product_line.index,
    orientation="h",
    title="每种商品销售总额",
    color_discrete_sequence=["#0083B8"] * len(sales_by_product_line),
    template="plotly_white",
)
fig_product_sales.update_layout(
    plot_bgcolor="rgba(0,0,0,0)",
    xaxis=(dict(showgrid=False))
)

每小时销售情况(柱状图)
sales_by_hour = df_selection.groupby(by=["小时"]).sum()[["总价"]]
print(sales_by_hour.index)
fig_hourly_sales = px.bar(
    sales_by_hour,
    x=sales_by_hour.index,
    y="总价",
    title="每小时销售总额",
    color_discrete_sequence=["#0083B8"] * len(sales_by_hour),
    template="plotly_white",
)
fig_hourly_sales.update_layout(
    xaxis=dict(tickmode="linear"),
    plot_bgcolor="rgba(0,0,0,0)",
    yaxis=(dict(showgrid=False)),
)

left_column, right_column = st.columns(2)
left_column.plotly_chart(fig_hourly_sales, use_container_width=True)
right_column.plotly_chart(fig_product_sales, use_container_width=True)

添加数据、设置图表配置和页面布局。

[En]

Add data, set chart configuration, and page layout.

得到结果如下。

06. 隐藏部件

当我们通过Streamlit搭建一个界面,默认就会有红线、菜单、结尾的”Make with Streamlit”。

为了美观,你可以把它们都藏在这里。

[En]

For the sake of beauty, you can hide them all here.

隐藏streamlit默认格式信息
hide_st_style = """

            #MainMenu {visibility: hidden;}
            footer {visibility: hidden;}
            header {visibility: hidden;}

"""

st.markdown(hide_st_style, unsafe_allow_html=True)

这样一个互动销售数据看板,建成了!

[En]

Such an interactive sales data Kanban, completed to build!

安装依赖库
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple plotly==4.14.3
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas==1.1.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple streamlit==0.86.0
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl==3.0.6

运行
streamlit run app.py

安装相关依赖项并在命令行终端运行程序。

[En]

Install related dependencies and run the program at the command line terminal.

最后

今天的分享到此结束。你明天想看什么?你可以私下给我留言!我将在下一篇文章中见到你。

[En]

This is the end of today’s sharing. What do you want to see tomorrow? You can leave me a message in private! I’ll see you in the next article.

Original: https://www.cnblogs.com/1234567FENG/p/16378938.html
Author: 蚂蚁爱Python
Title: 用Python制作销售数据可视化看板,展示分析一步到位

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/499365/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球