当前位置:首页 > 内容营销 > 正文

适者生存:优化中的进化算法

适者生存:优化中的进化算法

如果您经常阅读此博客,您可能不需要 CRO 或 A/B 测试的介绍。 您了解主要参与者、最佳实践,并且您已经...

如果您经常阅读此博客,您可能不需要 CRO 或 A/B 测试的介绍。 您了解主要参与者、最佳实践,并且您可能已经测试了您公平分享的想法。

但是,作为专家,您可能知道当前方法的一些持续挫折。 仅命名一对:

  • 测试只是需要时间。
  • 我们最好的直觉往往是错误的。

事实上,只有七分之一的测试是真正成功的。

但人工智能的新进展可能会有所帮助。

快点,在我们开始之前,值得一提的是我们所说的“人工智能”是什么意思。 毕竟,这个词有点含糊,不同的人在谈论我们时有不同的意思。

对我们来说,人工智能意味着一个可以自主决策的智能系统。 人工智能学习并影响周围的世界。

对于 CRO 而言,这意味着 AI 可以从用户交互中学习并决定接下来要测试的内容。 它了解行为,并有能力在提升好想法的同时剔除坏主意。 尽管 AI 中有多种形式,但在这篇文章中,我们将深入探讨我们构建 Sentient Ascend 的具体形式:进化算法。

进化算法入门

那么,什么是进化算法?

简而言之,进化算法和更广泛的进化计算领域是一种模仿达尔文自然选择的人工智能。

算法像有机体一样向更理想的解决方案进化,它们的进化就像在生物世界中一样:更适合解决问题的算法随着时间的推移会繁殖并产生越来越好的世代,而更糟糕的算法则是有效地从人口中移除。

算法由单独的“基因”(单独的规则或代码片段)组成,好的基因在算法的连续几代中传播,而表现不佳的基因,如表现不佳的算法,会被淘汰。

健康

算法进化和选择好基因的关键是适应度的概念。

适应性是使一个物种(或算法)优于另一个物种的特征。 在自然界中,这通常被定义为达到繁殖年龄并成功繁殖。 但健身可以是任何东西——赚钱、解决医疗问题的药物设计——无论你的目标是什么。

例如,看看这张图。 它显示了基因型 A 的频率随时间增加,其相对适合度比基因型 B 高 1%:

需要注意的是,构成算法的基因和适应度指标是由从业者创建的。 这些不是从互联网上获取他们想要的任何数据并随意应用的流氓算法。 相反,它们具有离散的目标和成分。

来自电子游戏世界的例子

让我们看一个名为 MarI/O 的程序中这些概念的简单但有启发性的示例。 MarI/O 是一种试图在马里奥兄弟游戏中击败关卡的 AI。

当然,离散目标是完成关卡。 这意味着 AI 在关卡中越深入,它就越“适合”或越成功。

它做出的决定是基于玩家在游戏中可以采取的行动,即按下按钮来跑、跳或移动某个方向。 如果马里奥在三秒内死亡? 这不是一个特别好的算法。 如果他比上一代做得更远? 然后你用其他成功的策略培育新算法,修剪那些做得更差的算法,培育出更进一步的算法。 你这样做了足够多的时间,MarI/O 就超过了这个水平。

而且,剧透警报,它确实如此。

通过进化算法进行产品设计

早在 2002 年,《西雅图时报》就写过一篇关于一家名为 Affinova 的年轻公司的文章,该公司“已经找到了如何利用自然选择的力量”进行产品进化。

在文章中,他们谈到了绘儿乐将利用该技术追求的机会:

“整个过程看起来像是格雷戈尔·孟德尔和弗兰肯斯坦博士的混合体。 Crayola 将把一批最畅销的毡尖笔与一批带有新基因的钢笔相结合,这些笔是 Crayola 设计师梦寐以求的新想法。 这些新钢笔可能有不同种类的笔帽或不同的笔管锥度。

Crayola 的客户将对转基因钢笔进行评估,并将其分为客户喜欢和不喜欢的两类。

没人喜欢的笔会被牺牲,但被喜爱的笔将被允许繁殖并拥有自己的孩子。 然后整个过程将重复。”

自 2002 年以来,它们取得了长足的进步,后来被尼尔森收购:

当然,Affinova 使用的这种演变使用态度数据来做出决策。 这在广告、产品设计以及新功能和创意的形成研究中具有有趣的应用。

但是让我们看看如何在实验中使用类似的算法,使用动作来创建决策……

人工智能在实验中的工作原理

我们的程序 Sentient Ascend 使用了类似的概念,但不是应用它们来击败令人不安的 Nintendo 游戏,而是帮助网站更好地转换。

首先,让我们从适应度衡量(或成功的构成要素)开始。 没有它,算法终究没有目的。 既然我们在这里谈论 CRO,我们的成功是通过增加转化来衡量的,无论是销售线索、购买、表单提交,你都能说出它的名字。 这是容易的部分。 现在让我们了解遗传算法如何一次测试大量想法并获得更好的转换网站。

想象一下您对网站的所有想法。 对于我们大多数人来说,我们一直在测试一个想法与另一个想法(因此是 A/B 测试)。 有了遗传算法,情况就不一样了。 您实际上可以一次输入您的所有想法,并让您的网站根据您提供的基因发展。

好的。 所以 Ascend 的工作方式是这样的:首先,你将每个想法输入到 Ascend 中——这意味着标题副本、按钮颜色、删除元素、新图像等——然后,Ascend 开始单独测试每个更改。 这意味着如果您想尝试三个新标题,程序会根据您选择的转化目标对每个标题进行测试。 如果您想测试四个新的 CTA,它也会单独测试它们。 号召性用语位置、图像、你的名字也是如此。 在第一轮初始测试之后,Ascend 已经注意到哪些基因具有良好的基因,即与您的对照版本一样好或更好。

这就是有趣的地方。 接下来,Ascend 开始培育这些组合。 意思是,它将显示一个成功的标题和一个有希望的图像,然后评估它们的组合效果,然后测试所有优于您的控制站点的变量组合。 然后它从该种群中选择获胜者,并继续与其他获胜者进行育种。

结果仪表板

但是这里也发生了其他重要的事情,那就是突变。

您最初输入的一些想法可能只是因为它们没有与正确的变量配对而失败。

例如,某个标题可能不会起作用,除非它与某个英雄图像一起显示。 因此,Ascend 不是永远忽略最初不起作用的想法,而是通过重新添加这些变量来“改变”您的网站,以确保它们实际上表现不佳。 这种繁殖、重组和突变会持续几代人,直到 Ascend 汇聚到一个获胜的候选人。 在这一点上,最好的做法是运行一个测试,比较由特定变量组合组成的候选人与您的控制,以可靠地验证这些发现。

价值在于突变(图片来源)

案例研究:老爷车清算人

Ascend 在需要测试的变量很多的情况下表现出色。 毕竟,就像进化一样,更多的选择意味着更多的成功可能性。

一个很好的例子是 Classic Car Liquidators (CCL) 在他们的网站上进行的为期七周的测试。 不出所料,CCL 销售老爷车,但也与 eBay 合作开展附属计划。 当购物者无法在 CCL 上找到他们梦想中的汽车时,他们的想法是,他们点击 eBay 附属链接,CCL 就会获得折扣。 他们是这样开始的:

但只有 0.88% 的用户点击了促销活动。 他们使用 Ascend 来优化横幅,测试了 9 种不同促销元素的 61 个版本。 总而言之,这是近 29,000 种可能的组合。 他们进行了七周的测试,结果如下:

上涨? 点击率提高了 434%。

现实情况很简单,A/B 测试在两个月内无法找到这个确切的设计。 测试的变量实在是太多了,尤其是使用进化算法,您可以找到最佳的想法组合。 您会注意到,在改进的控件中几乎没有发现控件。 那说:

没有银弹:要记住的事情

虽然一次测试大量的想法可以为您节省大量的时间,但需要预先付出一些努力。 基本上,当您在一个月内压缩一两年的测试时,您也在压缩设置时间。 这意味着 QA、编码、批准和更多想法的构思是一次性完成的。 特别是,如果您正在尝试雄心勃勃的测试(例如多页设计或布局创意),那么 QA 肯定会花费一些时间。

相反,如果您没有进行足够的测试,则可能会有不利影响。 基本上,如果你只是测试几个想法,你就没有利用进化的力量。

进化赋予人们的自由有时会激励他们尝试更糟糕的想法。 有些人不会剔除一些糟糕的标题,而是真的会尝试一切,而不是专注于他们现在所做的:产生高质量的假设。

图片来源

创意仍然很重要。 Ascend 只是在搜索最佳表现者时尝试这些更改的组合,但它不会编写新副本或执行任何您未明确告诉它的事情。 它随着你赋予它的基因而进化。

至于细分,是的,您可以细分受众并针对任何特定人群进行测试。 此外,通过与分析的集成,即使您没有针对特定细分市场进行优化,您也可以查看不同细分市场对各种候选设计的反应。

结论

未来十年,人工智能将无处不在。

它已经驱动了我们的搜索引擎、社交媒体和推荐算法。 个人助理和聊天机器人正在取得巨大而切实的进步。 这份清单不胜枚举。 人工智能也将用于转化率优化。

也就是说,没有什么可担心的。 很多关于人工智能的新闻都是小鸡式的,人工智能正在为我们的工作而来,我们应该害怕,非常害怕。 但人工智能并不是为我们的工作而来。 它的到来是为了让我们更好地完成工作。 不是要取代 CRO 专业人员,而是要让他们有能力尝试更多并取得更大的成功。

特色图片来源

,

最新文章