<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>数据科学 on Answer</title>
    <link>https://answer.freetools.me/categories/%E6%95%B0%E6%8D%AE%E7%A7%91%E5%AD%A6/</link>
    <description>Recent content in 数据科学 on Answer</description>
    <generator>Hugo -- 0.152.2</generator>
    <language>zh-cn</language>
    <lastBuildDate>Thu, 12 Mar 2026 21:08:27 +0800</lastBuildDate>
    <atom:link href="https://answer.freetools.me/categories/%E6%95%B0%E6%8D%AE%E7%A7%91%E5%AD%A6/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>当99%准确率成为谎言：机器学习评估指标的深层博弈</title>
      <link>https://answer.freetools.me/%E5%BD%9399%E5%87%86%E7%A1%AE%E7%8E%87%E6%88%90%E4%B8%BA%E8%B0%8E%E8%A8%80%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E8%AF%84%E4%BC%B0%E6%8C%87%E6%A0%87%E7%9A%84%E6%B7%B1%E5%B1%82%E5%8D%9A%E5%BC%88/</link>
      <pubDate>Thu, 12 Mar 2026 21:08:27 +0800</pubDate>
      <guid>https://answer.freetools.me/%E5%BD%9399%E5%87%86%E7%A1%AE%E7%8E%87%E6%88%90%E4%B8%BA%E8%B0%8E%E8%A8%80%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E8%AF%84%E4%BC%B0%E6%8C%87%E6%A0%87%E7%9A%84%E6%B7%B1%E5%B1%82%E5%8D%9A%E5%BC%88/</guid>
      <description>从混淆矩阵的数学根基出发，系统解析准确率、精确率、召回率、F1-score等分类指标的本质与局限，深入剖析ROC/PR曲线与AUC的工作原理，揭示为何准确率会在不平衡数据上&amp;#34;说谎&amp;#34;，以及医疗诊断、欺诈检测等场景中如何正确选择评估指标。</description>
    </item>
    <item>
      <title>推荐系统如何从海量数据中读懂你的心思：从协同过滤到深度学习的三十年技术突围</title>
      <link>https://answer.freetools.me/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E5%A6%82%E4%BD%95%E4%BB%8E%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E4%B8%AD%E8%AF%BB%E6%87%82%E4%BD%A0%E7%9A%84%E5%BF%83%E6%80%9D%E4%BB%8E%E5%8D%8F%E5%90%8C%E8%BF%87%E6%BB%A4%E5%88%B0%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E7%9A%84%E4%B8%89%E5%8D%81%E5%B9%B4%E6%8A%80%E6%9C%AF%E7%AA%81%E5%9B%B4/</link>
      <pubDate>Sat, 07 Mar 2026 22:35:24 +0800</pubDate>
      <guid>https://answer.freetools.me/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E5%A6%82%E4%BD%95%E4%BB%8E%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E4%B8%AD%E8%AF%BB%E6%87%82%E4%BD%A0%E7%9A%84%E5%BF%83%E6%80%9D%E4%BB%8E%E5%8D%8F%E5%90%8C%E8%BF%87%E6%BB%A4%E5%88%B0%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E7%9A%84%E4%B8%89%E5%8D%81%E5%B9%B4%E6%8A%80%E6%9C%AF%E7%AA%81%E5%9B%B4/</guid>
      <description>深入解析推荐系统的技术演进。从1992年Tapestry系统开创协同过滤先河，到Netflix Prize推动矩阵分解革命，再到深度学习时代YouTube DNN、两塔模型、BERT4Rec的技术突破。系统阐述多阶段漏斗架构、冷启动问题解决方案、流行度偏差等核心挑战，以及NDCG、MAP等评估指标背后的权衡逻辑。</description>
    </item>
    <item>
      <title>一个被对数表泄露的秘密：为什么数字1总是赢家</title>
      <link>https://answer.freetools.me/%E4%B8%80%E4%B8%AA%E8%A2%AB%E5%AF%B9%E6%95%B0%E8%A1%A8%E6%B3%84%E9%9C%B2%E7%9A%84%E7%A7%98%E5%AF%86%E4%B8%BA%E4%BB%80%E4%B9%88%E6%95%B0%E5%AD%971%E6%80%BB%E6%98%AF%E8%B5%A2%E5%AE%B6/</link>
      <pubDate>Sat, 07 Mar 2026 22:25:51 +0800</pubDate>
      <guid>https://answer.freetools.me/%E4%B8%80%E4%B8%AA%E8%A2%AB%E5%AF%B9%E6%95%B0%E8%A1%A8%E6%B3%84%E9%9C%B2%E7%9A%84%E7%A7%98%E5%AF%86%E4%B8%BA%E4%BB%80%E4%B9%88%E6%95%B0%E5%AD%971%E6%80%BB%E6%98%AF%E8%B5%A2%E5%AE%B6/</guid>
      <description>深入解析Benford定律的数学原理与广泛应用。从Simon Newcomb发现对数表磨损规律，到Frank Benford验证20,229个数据点，再到Mark Nigrini将其应用于欺诈检测。系统阐述尺度不变性证明、对数均匀分布原理，以及该定律在会计欺诈检测、选举数据分析、宏观经济数据核查、COVID-19数据质量评估、AI生成图像识别等领域的实际应用与局限性。</description>
    </item>
    <item>
      <title>为什么你的A/B测试结果总是不可靠？从p值陷阱到多重比较的统计困境</title>
      <link>https://answer.freetools.me/%E4%B8%BA%E4%BB%80%E4%B9%88%E4%BD%A0%E7%9A%84a/b%E6%B5%8B%E8%AF%95%E7%BB%93%E6%9E%9C%E6%80%BB%E6%98%AF%E4%B8%8D%E5%8F%AF%E9%9D%A0%E4%BB%8Ep%E5%80%BC%E9%99%B7%E9%98%B1%E5%88%B0%E5%A4%9A%E9%87%8D%E6%AF%94%E8%BE%83%E7%9A%84%E7%BB%9F%E8%AE%A1%E5%9B%B0%E5%A2%83/</link>
      <pubDate>Sat, 07 Mar 2026 22:11:52 +0800</pubDate>
      <guid>https://answer.freetools.me/%E4%B8%BA%E4%BB%80%E4%B9%88%E4%BD%A0%E7%9A%84a/b%E6%B5%8B%E8%AF%95%E7%BB%93%E6%9E%9C%E6%80%BB%E6%98%AF%E4%B8%8D%E5%8F%AF%E9%9D%A0%E4%BB%8Ep%E5%80%BC%E9%99%B7%E9%98%B1%E5%88%B0%E5%A4%9A%E9%87%8D%E6%AF%94%E8%BE%83%E7%9A%84%E7%BB%9F%E8%AE%A1%E5%9B%B0%E5%A2%83/</guid>
      <description>深入解析A/B测试中假阳性率膨胀的统计学根源。从Evan Miller的经典分析到Netflix的实践经验，从p值的数学本质到多重比较问题，系统揭示为什么&amp;#34;偷看数据&amp;#34;能让假阳性率从5%飙升到26%，以及序贯检验、alpha spending函数等解决方案的工程实践。</description>
    </item>
    <item>
      <title>一个不存在的日期：Excel为何保留了四十二年的错误</title>
      <link>https://answer.freetools.me/%E4%B8%80%E4%B8%AA%E4%B8%8D%E5%AD%98%E5%9C%A8%E7%9A%84%E6%97%A5%E6%9C%9Fexcel%E4%B8%BA%E4%BD%95%E4%BF%9D%E7%95%99%E4%BA%86%E5%9B%9B%E5%8D%81%E4%BA%8C%E5%B9%B4%E7%9A%84%E9%94%99%E8%AF%AF/</link>
      <pubDate>Sat, 07 Mar 2026 12:55:32 +0800</pubDate>
      <guid>https://answer.freetools.me/%E4%B8%80%E4%B8%AA%E4%B8%8D%E5%AD%98%E5%9C%A8%E7%9A%84%E6%97%A5%E6%9C%9Fexcel%E4%B8%BA%E4%BD%95%E4%BF%9D%E7%95%99%E4%BA%86%E5%9B%9B%E5%8D%81%E4%BA%8C%E5%B9%B4%E7%9A%84%E9%94%99%E8%AF%AF/</guid>
      <description>深入剖析Excel中最持久的软件bug——1900年闰年错误。从1983年Lotus 1-2-3的内存优化决策，到Microsoft为兼容性而故意复制错误，再到Joel Spolsky与Bill Gates的传奇对话。探讨闰年规则的科学原理、日期系统的工程权衡、以及软件兼容性为何成为不可承受之重。揭示一个幽灵日期如何在四十二年间影响了全球数十亿用户的日常工作。</description>
    </item>
    <item>
      <title>数据可视化：为什么你的图表总是选错</title>
      <link>https://answer.freetools.me/%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96%E4%B8%BA%E4%BB%80%E4%B9%88%E4%BD%A0%E7%9A%84%E5%9B%BE%E8%A1%A8%E6%80%BB%E6%98%AF%E9%80%89%E9%94%99/</link>
      <pubDate>Wed, 04 Mar 2026 18:14:38 +0800</pubDate>
      <guid>https://answer.freetools.me/%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96%E4%B8%BA%E4%BB%80%E4%B9%88%E4%BD%A0%E7%9A%84%E5%9B%BE%E8%A1%A8%E6%80%BB%E6%98%AF%E9%80%89%E9%94%99/</guid>
      <description>深入解析数据可视化图表选择的底层逻辑：从认知心理学的格式塔原理到 Edward Tufte 的数据墨水比理论，系统阐述如何根据数据类型和分析目标选择正确的图表类型。揭示饼图争议背后的科学依据、颜色选择的认知陷阱，以及常见可视化误区的规避方法。</description>
    </item>
  </channel>
</rss>
