# 1.什么是数据可视化?
数据可视化就是对信息和数据进行图形化的展示。通过使用图表、地图等可视化元素,数据可视化给我们提供了一种更方便的了解数据的方式,通过数据可视化我们可以观察和理解数据中的趋势、异常值以及数据中包含的模式。大数据的世界中,在对大量数据进行分析以及通过数据做决策的过程中,数据可视化的工具和技术都是必不可少的。
# 2.数据可视化的优势
我们的眼睛更容易受到颜色和图形的吸引。例如,我们可以很快速地区分红色和蓝色,正方形和圆形。在现实生活中,不管是艺术、广告还是电视剧、电影都是视觉化的。数据可视化是另一种形式的视觉艺术。当我们看到一个图表,可以很快速地了解数据的趋势和异常值。如果你曾经有过盯着一个巨大的电子表格中的数据而看不出其中的趋势时,你就能理解数据可视化在展示数据趋势这方面是多么高效。
当大数据时代扑面而来的时候,可视化是使得大量数据变得有意义的最重要的工具。一个好的数据可视化在讲述一个故事,它去除了噪音数据并突出了有用的信息。但是,一个好的数据可视化并不是简简单单的把一个图表做的好看这么简单。一个高效的数据可视化需要在形式和功能之间达成一个平衡。朴素的图表由于太过于无聊而不能引起观察者的注意,华丽的图表往往由于太注重形式而不能传递正确的信息,所以需要在形式和功能之间达成一个平衡。
# 3.如何进行数据可视化?
如何做才能使数据可视化更有趣并且能为不同的受众所接受?不管你是新手或者经验丰富的数据分析师,在进行数据可视化之前,问自己如下问题:
- 我的受众是谁?
- 他们有什么问题?
- 我为他们寻找的答案是什么?
- 我想说的是什么?
- 我的数据可视化可以激发其他什么问题? 基于对上述问题的比较好的回答,你的数据可视化犹如在讲述一个有趣的故事,并且能够揭示出隐藏在数据背后的信息和细节。当我们已经准备好对数据进行可视化时,下面的一些技巧和技术将能够使你的数据可视化更直观和更有趣。
# 3.1 选择正确的图表
没有哪一种图表是具有普适性的,所以我们需要认真考虑并选择正确的图表,选择的图表要最适合用来讲故事并且能够回答关键的问题。下面我们来讲下比较受欢迎的图表。
# 3.1.1 条形图
条形图是最常见的图表,适合用来比较不同类别的值。当我们的数据可以划分为多个不同的类别时,使用条形图可以非常有效地对其进行可视化。
# 3.1.2 折线图
折线图是一个由点和线组成的统计图表,常用来表示数值随连续时间间隔或有序类别的变化。折线图用于分析事物随时间或有序类别而变化的趋势。如果有多组数据,则用于分析多组数据随时间变化或有序类别的相互作用和影响。折线的方向表示正/负变化。折线的斜率表示变化的程度。
# 3.1.3 直方图
直方图,又称质量分布图,用于表示数据的分布情况,是一种常见的统计图表。一般用横轴表示数据区间,纵轴表示分布情况,柱子越高,则落在该区间的数量越大。
# 3.1.4 饼图
饼图,或称饼状图,是一个将圆形划分为几个扇形的统计图表。在饼图中,每个扇形的弧长大小,表示该种类占总体的比例,这些扇形合在一起刚好是一个完整的圆形。
# 3.2 注意页面的布局
人类天生就是视觉动物,我们的眼睛会被一目了然地告诉我们主要信息的指标所吸引。当数据可视化结果呈现在我们眼前时,我们会很自然地寻找模式,如果模式是随机的或者没有意义,就很难理解可视化所传达的内容。为了迎合人类的习惯,请确保呈现数据的顺序或格式对观众有意义,不论是按照数字顺序还是按照字母顺序。举一个简单的例子,如果我们用于交流的语言的阅读习惯是从左到右,那么我们就要调整可视化的方案以遵守这个约定。如果使用多个图表,那么我们要确保顺序一致并且数据之间的联系要清晰。我们之所以要这样做,就是要我们的观众在观看数据可视化时不至于迷路。
# 3.3 注意颜色的使用
在进行数据可视化时,颜色的使用很重要,它可以在不使用文字的情况下传达足够多的信息。然而,在使用颜色时要找到一个平衡点,保持简单最重要。颜色的使用是为了突出和强调信息,如果使用过多的颜色则会引入噪音,反而影响了重要信息的表达。如果使用的颜色过于单一,则不能突出重要的信息。另外,颜色联想也很重要,建议使用对观看者来说有意义的颜色,以便他们能够更快地处理信息。例如,如果我们正在对温度进行可视化,可以使用红色表示热,使用蓝色表示冷。颜色的使用将会对可视化产生重要的影响,务必保持一致性以及突出数据中的对比。
# 3.4 通过形状和设计来传递上下文
上下文可以帮助我们在第一眼看过去就知道所要传达的信息,而不是坐下来仔细研究它。形状的使用可以讲述引人入胜的故事。例如,上面关于非洲濒危物种的图表可以让我们快速了解哪些动物处于濒危状态以及它们的脆弱程度。在使用带值的条形图来表示上述数据时,每个动物都被最小化为数字和文本,这时候图表的查看者容易迷失方向,相反,使用动物剪影使其更加有趣和直观。
# 3.5 策略性地使用大小对值可视化
在之前的可视化例子中,使用颜色来表示动物濒临灭绝的程度。除了使用颜色之外也可以使用大小,形状大小可以根据数据值进行调整。使用形状的大小来指示值的大小也适用于地图。当可视化图表中有多个大小相同的数据点时,它们会混合在一起并且很难区分。这时候我们可以根据值的大小对图形进行缩放,并且添加颜色作为另一个标记。这时候可视化将更容易传递信息。如下图所示:
# 3.6 注意文本的使用
最后,文本的使用可以改善可视化的效果,但是,当文本过多或没有以视觉上令人愉悦的方式组织时,文本会让人分心。在使用文本时,确保文本指出最重要的细节。相对于文本来说,虽然我们更习惯于图像,但是在真正重要的地方使用文本将使可视化产生意想不到的效果。接下来是使得可视化更加优秀的一些建议。
- 将最重要的图表放在顶部或左上角。因为我们的眼睛通常首先被这个区域吸引。
- 将可视化中的图表数量限制为三个或四个。如果添加太多,就会迷失在细节中。
- 如果有多个过滤器,尝试将它们组合在一起。并用浅色边框将他们围起来,这样会给我们一个视觉提示,表明它们具有共同的特征。
- 增加可视化的互动性,互动性往往具有点石成金的作用。在增加了互动性之后,要鼓励观众进行探索,以使得他们能够参与进来。
# 4.总结
本节课我们讲述了如何进行可视化,在可视化的过程中要注意的事项以及颜色、文本的使用等等。