做淘宝好还是自建网站好,中国古建筑网站,手机网站建设报价,企业邮箱哪家安全原文地址#xff1a;https://duckdb.org/2026/03/11/big-data-on-the-cheapest-macbook 标题#xff1a;最便宜 MacBook 上的大数据处理 作者头像 Gbor Szrnyas 2026-03-11 7 分钟 太长不看版#xff1a; 最新的入门级 MacBook 在数据库工作负载上的表现如何#xff1f;我…原文地址https://duckdb.org/2026/03/11/big-data-on-the-cheapest-macbook标题最便宜 MacBook 上的大数据处理作者头像Gábor Szárnyas2026-03-11 · 7 分钟太长不看版最新的入门级 MacBook 在数据库工作负载上的表现如何我们通过基准测试来一探究竟。苹果今天发布了 MacBook Neo现在不乏各种技术评测来解释它是否适合学生、摄影师或作家。但他们没有告诉你的是它是否符合我们在你的笔记本电脑上处理大数据的理念。我们想用数据驱动的方法来回答这个问题所以我们去了最近的苹果专卖店买了一台回来进行测试。包装盒里有什么嗯东西不多如果你在欧盟购买这台机器甚至不附带充电头。你只会得到笔记本电脑和一根编织的 USB-C 数据线。不过你可能已经有几个闲置的 USB-C 充电头了——让我们继续来看笔记本电脑本身吧硬件规格中唯一可以选择的部分是硬盘你可以选择 256 GB 或 512 GB。由于我们的任务是处理所谓的大数据我们选择了较大的选项这使得在美国的售价为 700 美元在欧盟为 800 欧元。内存容量是固定的 8 GB。虽然只有一个 CPU 选项但它相当有趣这台笔记本电脑搭载的是 6 核苹果 A18 Pro 芯片原本是为 iPhone 16 Pro 打造的。事实证明我们已经在一些不同寻常的情况下测试过这款手机。早在 2024 年使用 DuckDB v1.2-dev 版本我们发现 iPhone 16 Pro 在空气冷却的情况下可以在大约 10 分钟内完成 TPC-H 基准测试比例因子为 100的所有查询而放在一盒干冰中则只需不到 8 分钟。MacBook Neo 绝对应该能够处理这个工作负载——也许它甚至能处理更多。不可避免的基准测试来了ClickBench 基准测试在我们的第一个实验中我们使用了 ClickBench一个分析型数据库基准测试。ClickBench 有 43 个查询侧重于聚合和过滤操作。这些操作在一个包含 1 亿行数据的单一宽表上运行该表序列化为 Parquet 格式时占用约 14 GB存储为 CSV 格式时占用 75 GB。基准测试环境我们将 ClickBench 的 DuckDB 实现移植到了 macOS 上并使用刚刚发布的 v1.5.0 版本在 MacBook Neo 上运行。我们只做了一个小的调整正如我们的性能指南中所建议的我们将内存限制略微降低到 5 GB以减少对操作系统交换空间的依赖并让 DuckDB 为大于内存的工作负载处理内存管理。这在内存受限的环境中是一个常见的技巧因为其他进程可能正在使用超过 20% 的系统总内存。我们还在两个云实例上使用 DuckDB v1.5.0 重新运行了 ClickBench得到了以下对比阵容MacBook Neo配备 2 个性能核心、4 个能效核心和 8 GB 内存c6a.4xlarge配备 16 个 AMD EPYC vCPU 核心和 32 GB 内存c8g.metal-48xl配备多达 192 个 Graviton4 vCPU 核心和 384 GB 内存基准测试脚本首先将 Parquet 文件加载到数据库中。然后按照 ClickBench 的规则每个查询运行三次以捕获冷运行首次运行缓存为空和热运行系统有机会利用文件系统缓存等的情况。结果与分析我们的实验产生了以下总运行时间以秒为单位机器冷运行 (中位数)冷运行 (总计)热运行 (中位数)热运行 (总计)MacBook Neo0.5759.730.4154.27c6a.4xlarge1.34145.080.5047.86c8g.metal-48xl1.54169.670.054.35冷运行。结果一开始就出现了一个大惊喜在冷运行中MacBook Neo 以低于 1 秒的中位数运行时间成为明显的赢家在一分钟内完成了所有查询当然如果我们深入分析配置这可以找到解释。云实例配备了网络附加存储访问这些实例上的数据库占据了查询运行时间的绝大部分。MacBook Neo 有一个本地 NVMe 固态硬盘虽然不是最顶尖的但在首次读取时仍然提供了相对较快的访问速度。热运行。在热运行中MacBook 的总运行时间仅改善了约 10%而云机器开始发挥其真正的实力c8g.metal-48xl 以数量级的优势胜出。然而值得注意的是在查询运行时间中位数上MacBook Neo 仍然可以击败 c6a.4xlarge一个中等规模的云实例。尽管这个云实例多拥有 10 个 CPU 线程和 4 倍的内存但笔记本电脑的总运行时间仅慢了约 13%。TPC-DS 基准测试在我们的第二个实验中我们选择了 TPC-DS 基准测试的查询。与有 8 张表和 22 个查询、无处不在的 TPC-H 基准测试相比TPC-DS 拥有 24 张表和 99 个查询其中许多查询更复杂包含了诸如窗口函数之类的特性。而且虽然 TPC-H 已经被优化到了极致但 TPC-DS 的结果仍然具有一定的参考价值。让我们看看这款最便宜的 MacBook 能否处理这些查询在这一轮中我们使用了 DuckDB 的 LTS 版本 v1.4.4。我们使用 DuckDB 的 tpcds 扩展生成了数据集并将内存限制设置为 6 GB。在 SF100 规模因子下笔记本电脑轻松完成了大部分查询查询运行时间中位数为 1.63 秒总运行时间为 15.5 分钟。在 SF300 规模因子下内存限制开始显现。虽然查询运行时间中位数仍然相当不错为 6.90 秒但 DuckDB 有时会使用高达 80 GB 的空间进行磁盘溢出并且很明显有些查询将花费很长时间。最值得注意的是查询 67 耗时 51 分钟才完成。但硬件和软件继续不知疲倦地协同工作最终它们通过了测试在 79 分钟内完成了所有查询。你应该买一台吗事情是这样的如果你每天都要在笔记本电脑上运行大数据工作负载你可能不应该购买 MacBook Neo。没错DuckDB 可以在它上面运行并且可以通过利用外核处理来处理大量数据。但 MacBook Neo 的磁盘 I/O 与 Air 和 Pro 型号相比相形见绌大约 1.5 GB/s而后者为 3–5 GB/s并且 8 GB 内存长远来看也会成为限制。如果你需要在移动中处理大数据并且可以多付一点钱其他 MacBook 型号将更好地满足你的需求而且 Linux 和 Windows 平台上也有不错的选择。话虽如此如果你在云端运行 DuckDB并且主要将笔记本电脑用作客户端那么这是一个很棒的设备。而且你可以放心如果你偶尔需要在本地处理一些数据MacBook Neo 上的 DuckDB 完全可以胜任这项挑战。