发布时间:2024-10-28 12:01
科学可视化通常被定义为以图形的方式显示数据的过程。但是,此过程远非直接或自动进行。表示相同数据的方法有很多:散点图,线性图,条形图和饼图等等。此外,根据谁在看该图,使用相同类型绘图的相同数据可能会有很大不同。科学可视化的更准确定义是人与数据之间的图形界面。在这篇简短的文章中,我们提供一组基本规则来改善图形设计并解释一些常见的陷阱。
根据上述定义,当视觉感受与图形传达的意图有很大不同时,就会出现问题。因此,重要的是在设计过程中尽早识别观众和视觉传达的信息。视觉的图形设计应以此意图为依据。如果您是为自己和直接合作者创建图形,则可以跳过设计过程中的许多步骤,因为每个人都知道图形的含义。但是,如果您打算在专业期刊上发表图片,则应确保您的图片正确无误,并将所有相关信息传达给更广泛的受众。学生听众需要特别注意,因为这种情况的目的是解释一个概念。在这种情况下,您可能必须添加其他信息以确保完全理解该概念。最后,公众可能是最困难的受众,因为您需要设计一个简单但又能完整表达研究中最突出部分内容的图表,如下图所示。
图表意在表达想法或陈述一些事实,这些事实不适合用文字来表达。 在这种情况下,重要的是清楚地确定图表的角色,即基本信息是什么,图表如何最好地表达这一信息?一旦明确这一点,将成为图形设计的有力指导,如下图所示。只有在明确了要传达的信息之后,才值得花时间创建图形,就好像在确定文章主题之后,才会撰写论点和论据。
图形可以显示在各种媒体上,例如海报,电脑屏幕,投影屏或报纸期刊。这些媒体中的每一种都代表图形的不同物理尺寸,但是更重要的是,它们各自还暗含了查看和与图形交互的不同方式。例如,在口头演示期间,将在有限的时间内显示图表。因此,观看者必须在仍然听取您的解释的同时快速了解显示的内容及其代表的含义。在这种情况下,必须使人物形象保持简单,并且必须在视觉上凸显信息,以引起注意,如图3所示。同样重要的是要记住,在口头演示过程中,图表形象将通过视频投影并可以从远处看到,因此必须将图形元素变粗(线)或变大(点,文本),颜色应具有强烈的对比度,并应避免垂直文本等。
无论是描述实验装置,引入新模型还是呈现新结果,您都无法解释图形本身中的所有内容,图形应带有标题。标题说明了如何阅读该图,并为无法用图形表示的内容提供了更高的精度。可以将其视为您在口头演讲时或在海报前进行的解释,但与众不同之处在于您必须事先考虑人们会问的问题。例如,如果有条形图,不要指望读者仅通过观察和测量图形上的相对高度来猜测不同条形的值。如果数值很重要,则必须在您文章的其他地方提供它们,或者在图上写得非常清楚。同样,如果图形中有一个兴趣点(关键域,特定点等),请确保它在视觉上是明显的,但不要在标题中再次指出。
任何绘图库或软件都带有一组默认设置。当最终用户未指定任何内容时,这些默认设置将用于指定大小,字体,颜色,样式,刻度,标记等,如下图所示。几乎可以指定任何设置,并且由于选择了这些默认设置,因此您通常可以识别每个软件包(Matlab,Excel,Keynote等)或库(LaTeX,matplotlib,gnuplot等)的特定样式。由于这些设置实际上可用于任何类型的绘图,因此对于特定类型的绘图,它们不会进行微调。换句话说,它们对任何案例都足够好,但对任何案例来说都不是最好的。所有图都需要至少对不同的设置进行一些手动调整,以更好地表达信息,这是为了使精确图更能吸引广大受众,或者为数据的性质选择最佳的色彩图。
颜色是人类视觉中的重要维度,因此在设计科学图形时同样重要。但是如果使用不当,色彩可能是您最大的盟友,也可能是您最大的敌人。如果决定使用颜色,则应考虑使用哪些颜色以及在何处使用它们。例如,要突出显示图形中的某些元素,可以为该元素使用颜色,同时使其他元素保持灰色或黑色。这提供了增强的效果。但是,如果您没有这种需要,则需要问自己:“是否有任何理由使该图是蓝色而不是黑色?” 如果您不知道答案,请保持黑色。颜色图(colormap)也是如此,除非有明确的理由,否则请不要使用默认的颜色图(例如,喷射色或彩虹色)。传统上,颜色图(colormap)主要分为三类:
使用与您的数据最相关的颜色图。
将科学图表与其他图形艺术品区分开来的是,需要尽可能客观地显示数据。根据定义,图表与数据相关(无论是实验设置,模型还是某些结果),但客观地表示结果并不总是那么简单。例如,您使用的库或软件所做的许多隐式选择在大多数情况下都是准确的,在某些情况下也可能误导观众。如果您的软件自动重新缩放值,那么您可能会获得客观的数据表示形式(因为标题,标签和刻度线清楚地表明了实际显示的内容),但是这在视觉上具有误导性,如下图,您无意中误导了读者,使他们从视觉上相信数据中不存在的内容。您还可以做出设计上错误的明确选择,例如使用饼图或3-D图表比较数量。已知这两种图会导致对数量的错误认识,因此需要一些专业知识才能正确使用它们。根据经验,请确保始终使用最简单的图表类型来传达您的信息,并确保在相关时使用标签,刻度,标题和所有值的范围。
有时候图表中存在不必要或令人困惑的视觉元素,这些元素不会改善要传达的信息,甚至导致混乱。例如,图表可能使用过多的颜色,过多的标签,无用的背景色,无用的网格线等。
自古代以来,数字就已经用于科学文献中。多年来,已经取得了很多进展,并且每个科学领域都开发了自己的最佳实践。了解这些标准很重要,因为它们有助于在模型,研究或实验之间进行更直接的比较。更重要的是,它们可以帮助您发现结果中的明显错误。但是,大多数时候,您可能需要设计一个崭新的图表,因为没有标准的方式来描述您的研究。在这种情况下,浏览科学文献是一个很好的起点。如果某篇文章显示了一个惊人的图表来介绍与您相似的结果,那么您可能想要尝试根据您自己的需要调整该图表。如果您在网络上搜索图表,则必须非常小心,因为数据可视化,信息图表,设计和艺术之间的边界越来越薄,网络上的图表将美观的样式排在第一位,内容排在第二。请记住,在科学可视化中,图表的信息和可读性是最重要的,美观只是选择,如下图所示。
有很多工具用于创建图表,根据要创建的视觉类型,通常会有一个专用的工具来完成您要实现的目标。在这一点上,重要的是要了解用于进行可视化的软件或库可能不同于用于进行研究和/或分析数据的软件或库。您始终可以导出数据以便在其他工具中使用它。无论是绘制图形,设计实验方案还是绘制一些数据,都有适合您的开源工具,以下是一小部分开源工具。
Matplotlib是一个python绘图库,主要用于2D绘图,但具有3D支持,可以在各种硬拷贝格式和跨平台的交互式环境中生成具有出版质量的图形。它带有大量的示例库,几乎涵盖了所有科学领域。
R语言用于数理统计和数据可视化。
Inkscape是专业的矢量图形编辑器。
TikZ和PGF是用于以编程方式创建图形的TeX软件包。
GIMP是GNU图像处理程序,它是用于照片修饰,图像合成和图像创作等任务的应用程序。
ImageMagick是一个用于从命令行创建,编辑,合成或转换位图图像的软件套件。
D3.js是一个JavaScript库,用于创建交互式的动态图表。
Cytoscape是用于可视化复杂网络并将其与任何类型的属性数据集成的软件平台。
Circos最初旨在可视化基因组数据,但可以从任何领域的数据中创建图形。
如果喜欢我们的文章,记得点赞和收藏哦,我们每天都会为大家带来Python,数据科学和量化交易的精品内容。
【关于我们】
蜂鸟数据:国内领先的金融数据API提供商。
蜂鸟数据团队由业界顶尖的数据工程师,数据科学家和宽客组成,我们正努力构建一个强大的金融数据库,并提供API接口,目标是令金融数据开源化和平民化。
浏览并测试我们接口吧,目前覆盖股票,外汇,商品期货,数字货币和宏观经济领域,包括实时报价(tick)和历史数据(分钟),提供REST API和Websocket两种接入方式,能够满足金融分析师,量化交易和理财app的需求。
需要金融数据?利用蜂鸟API将数据整合到您的应用
如果您准备好了,请登录蜂鸟官网,注册免费获取API密钥,然后开始探索我们的金融数据库吧。