计算机数据分析视频讲解,数据分析计算机基础

Excel基本技能数据透视表。


今天,我将向您介绍如何在Excel表格中插入数据透视表。首先,你会看到这样的数据表。这是一个公司的季度销售数据,记录了销售日期、销售人员、产品编号、类别、单价、数量、销售产品的数量。现在我们需要根据这些销售数据表创建一个数据透视表。


此数据透视表按产品显示每月总销售额和销售数据。让我们看看如何创建这样的数据透视表。


首先,将鼠标放在该表格的任意单元格上,然后在上一行找到插入,找到插入,您将看到下面的数据透视表,单击数据透视表。


点击选择范围,可以看到选中的表刚刚成为数据透视表。不过,有一点大家要注意虚线框选择的范围不包括表头,所以如果出现这种情况,必须在这个位置选择,在右边选择,然后再选择。满桌。此范围应包括转到表头,因为我们稍后将使用表头中的字段创建一些数据透视表数据。


现在整个表格都被选中了,表格外面会出现一个虚线边框,如果没有题,再次单击向右箭头。此时,整个表已被选中,您可以稍后根据此详细数据执行数据透视。


当然,有的同学会下面的多个合并计算区域如何使用。这实际上在当前工作表有多个区域时常用。您可以使用此选项并选择多个区域来透视数据。


第三种是在现有数据透视表中进行数据透视时选择第三种。但是,通常会选择在当前打开的工作表中旋转数据的第一个默认选项。所选数据的范围。


第二是指定数据透视表的存储位置。通常默认情况下保存到新工作表。当然,您也可以选择现有工作表中的位置(例如当前打开的工作表),并指定保存数据透视表的位置。您可以在此处在新工作表中创建数据透视表。


单击“确定”,您将进入新的工作表。此时,左侧显示稍后将创建数据透视表的位置。此时,你需要向右看。在右侧的数据透视表下方,有字段列表的选项,其中包括原始详细数据表中的所有字段或所有列。这时,根据你想要如何显示数据透视表,只需将相关字段拖到下面的数据透视表区域即可。


我们应该如何理解这个领域?让我简单解释一下。首先,行是每个数据透视表中都必须存在的元素,即指示每行显示什么信息的元素。例如,指定每一行按小时或按月显示对应的销售额总数,因此在此处下拉日期的行将存储该日期加一。


计算出来的值就是销售额,即每个月产生了多少销售额和收入。还有什么?这意味着您可以有列选项。例如,如果您想根据类别显示每种产品类型,则可以将此列放置在此处,并将产品类别放置在此处。


最后,您还可以根据不同的销售代表进行过滤。如果您没有看到该数据,可以单击刷新。完整的数据透视表数据。


在这里你可以根据销售人员的情况进行选择。例如,如果您选择方怡欣,然后单击“确定”,则只会出现方怡欣等一人的销售数据。默认情况下,选择所有销售人员的销售数据。显示的行是每个销售人员的销售数据,按产品类别、电和磁盘打印机显示总销售额。


一、大数据分析主要有哪些核心技术?

您想更好地了解传统数据和大数据之间的区别、在哪里可以找到它以及可以使用哪些技术来处理它?


这是您处理数据时应该采取的第一步,因此这是一个很好的起点,特别是如果您正在考虑从事数据科学职业的话!


“数据”是一个广义的术语,可以指“原始事实”、“处理后的数据”或“信息”。在详细讨论之前,让我们先将两者分开,看看它们是否是同一件事。


我们收集原始数据,然后对其进行处理以获得有意义的信息。


嗯,拆开很简单!


现在我们来看看细节吧!


原始数据(也称为“原始事实”或“原始数据”)是您积累并存储在我们的服务器上但未接触过的数据。这意味着无法立即对其进行分析。我们将收集原始数据称为“数据收集”,这是我们要做的第一件事。


什么是原始数据-


数据可以被认为是传统数据或大数据。如果您不熟悉这个想法,您可以想象表格形式的现有数据,其中包含分类数据和数字数据。数据被结构化并存储在可由计算机管理的数据库中。收集传统数据的一种方法是对人们进行调查。要求他们对产品或体验的满意度从1到10进行评分。


大多数人都熟悉传统数据。例如,订单管理可帮助您跟踪销售、采购、电子商务和工作订单。


但大数据则是另一回事了。


顾名思义,“大数据”是一个术语,指的是非常大的数据。


您还经常可以看到它们标有字母“V”。正如《大数据的3V》中提到的。有时可能有5个、7个、甚至11个“V”大数据。这可能包括您对大数据的愿景、大数据的价值、您使用的可视化工具或大数据一致性的可变性。ETC…


但要记住的最重要的标准是


体积


大数据需要大量的存储空间,并且通常分布在多台计算机上。大小以太字节、拍字节甚至艾字节为单位。


多样性


我们在这里谈论的不仅仅是数字和文字。大数据一般指处理图像、音频文件、移动数据等。


速度


处理大数据时,目标是尽快提取模式。我们在哪里遇到大数据?


案是越来越多的行业和公司正在发生这种情况。以下是一些著名的例子


“Facebook”是最大的在线社区之一,跟踪用户的姓名、个人数据、照片、视频、录制的消息等。这意味着他们拥有各种数据。全有20亿用户,服务器上存储的数据量非常巨大。


我们以“金融交易信息”为例。


如果你每五秒甚至每秒记录一次股价格,你就会得到一个巨大的数据集,需要大量的内存、磁盘空间和各种技术来提取有意义的信息。


传统数据和大数据都将为提高客户满意度提供坚实的基础。但是,该数据存在题,我们需要在执行其他操作之前对其进行处理。


如何处理原始数据-


让我们将原始数据变成美丽的东西!


收集到足够的原始数据后,首先要做的就是我们所说的“数据预处理”。它是一系列操作,将原始数据转换为更易于理解和有用的格式以供进一步处理。


这一步似乎被压缩在原始数据和处理之间。您可能需要在此处添加一个部分。


数据预处理


那么“数据预处理”的目的是什么呢?


我们尝试解决数据收集过程中可能出现的任何题。


例如,您收集的一些客户数据可能包括年龄为932岁的人或名字为“UK”的人。在执行分析之前,必须将该数据标记为无效或正确。这就是数据预处理的全部内容!


让我们看看在传统和大原始数据的预处理过程中所应用的技术。


类别标签


这涉及使用正确的数据类型标记数据点,即按类别对数据进行排序。


我们将传统数据分为两类


一是“数”。如果您存储每天销售的商品数量,则您正在跟踪一个数值。这些是可以操纵的数字。例如,您可以计算每天或每月销售的平均商品数量。


另一个标签是“绝对的”。在这里,我们正在处理数学无法处理的信息。比如说一个人的事业。请记住,数据点可能仍然是非数字的。出生日期是一个数字,无法直接操作以提供更多信息。


考虑基本的客户数据。--使用的数据集取自SQL课程。


将此表与有关客户的文本信息结合使用,以清楚地显示数字变量和分类变量之间的差异。


如果您查看第一列,您将看到分配给各个客户的ID。这些数字无法被操纵。“平均”ID不提供任何有用的信息。换句话说,尽管它是一个数字,但它没有数值,而是分类数据。


现在关注最后一栏。表示客户提出投诉的次数。您可以操纵这些数字。这是数字数据,因为将其加起来可提供投诉总数。


我们可以看的另一个例子是每日历史股价数据。


-这是我们Python课程中使用的内容。


此处显示的数据集有一列包含观察日期,该列被视为分类数据。还有一列包含有关股价格的数字数据。


当处理大数据时,事情会变得更加复杂。除了“数字”和“分类”数据之外,您还有以下附加选项


文本数据


数字图像数据


数字视频数据


数字音频数据


数据清理


也称为“数据清理”或“数据清理”。


数据清洗的目的是处理不一致的数据。这可以采取多种形式。假设您收集了一个包含美国各州的数据集,其中四分之一的名称拼写错误。在这种情况下,您需要执行某些技术来纠正这些错误。您需要删除您的数据。线索就是名字!


大数据有更多的数据类型和更多的数据组织方式。有一些技术可以确保数字图像可供处理。有一些特定的方法可以确定文件的音频质量是否足以继续。


缺失值


“缺失值”是另一个需要处理的题。并非所有客户都能提供他们需要的所有数据。经常发生的情况是,客户向我们提供了他们的姓名和职业,但没有提供他们的年龄。在这种情况下你能做什么?


我应该忽略客户的整个历史记录吗?或者您可以输入其他客户的平均年龄吗?


无论哪种解决方案,您都需要在进一步处理之前清理数据并处理缺失值。


现有数据处理技术


让我们看一下处理现有数据的两种常见技术。


平衡


假设您已经制定了一份调查卷来收集有关男性和女性购物习惯的数据。假设您想找出谁在周末花了更多的。然而,一旦完成数据收集,您就会发现80%的受访者是女性,只有20%是男性。


在这种情况下,您注意到的趋势将更倾向于女性。解决这个题的最好方法是应用平衡技术。例如,如果您从每组中抽取相同数量的受访者,则比例将为50/50。


数据改组


洗牌数据集中的观察结果就像洗牌一样。这可确保数据集不会表现出因有题的数据收集而产生的有害模式。数据混洗是一种有助于提高预测性能并防止错误结果的技术。


但如何避免误会——


嗯,这是一个详细的过程,但简单地说,洗牌是一种随机化数据的方法。如果您从数据集中获取前100个观察值,则它不是随机样本。首先提取最高的观测值。如果您打乱数据,如果您连续输入100个项目,它们将是随机输入的,并且很可能具有代表性。


大数据处理技术


让我们看一下处理大数据的一些特定案例的技术。


文本数据挖掘


想想以数字格式存储的大量文本。嗯,有许多科学项目正在进行,旨在从数字资源中提取特定的文本信息。例如,您可能有一个数据库,用于存储有关“营销支出”的学术论文的信息,这是一个主要研究主题。什么是大数据分析技术?如果数据库中存储的来源数量和文本量足够小,则很容易找到所需的信息。尽管总体数据量巨大。这可能包括学术论文、博客文章、在线和个人Excel文件等信息。


这意味着您需要从多个来源获取营销支出信息。换句话说,就是“大数据”。


这不是一件容易的事,这促使学者和实践者开发出执行“文本数据挖掘”的方法。


数据屏蔽


维护机密信息对于维持值得信赖的企业或政府运营至关重要。在线共享个人信息时,您可能需要对信息应用一些“数据脱敏”技术,以便在不损害参与者隐私的情况下进行分析。


与数据混洗一样,“数据屏蔽”可能很复杂。用随机和虚假数据隐藏原始数据,并分析所有机密信息并将其存储在安全的地方。将数据脱敏应用于大数据的一个例子是通过“机密数据挖掘”技术。


数据处理完成后,您将收到所需的有价值且有意义的信息。希望您对传统数据和大数据之间的区别以及如何处理它们有所了解。


二、试述文本、图像、声音、视频、动画等不同的媒体类型数据在计算机是如何存储的?

全部以字节码格式存储。例如,一张图片是由许多像素组成的。每个像素可以用一个字节来表示。这同样适用于其他内容。一旦确定了数据格式,我们就知道如何解析每个字节。


关于计算机数据分析视频讲解的相关话题,本文对数据分析计算机基础这样的内容已经进行了解,希望能帮助到各位!

除非特别注明,本站所有文字均为原创文章,作者:admin

No Comment

留言

电子邮件地址不会被公开。 必填项已用*标注

感谢你的留言。。。