您现在的位置是:首页 >科技 > 2020-04-07 10:23:25

让Apache Cassandra再次变得伟大DataStax向云开源和多模型发展

用代码驱动Cassandra普遍性。这是DataStax在发布针对Cassandra的开源Kubernetes操作符时提出的关键信息,同时还有改进的数据流和图形查询。

对于开源软件(OSS)和DataStax这样一个围绕核心开源Apache Cassandra构建的数据库供应商来说,在这个动荡的时代,这是值得探索的东西。ZDNet与Patrick McFadin, DataStax副总裁开发人员的关系,来讨论in和out。

正如我们在“大数据”(Big on Data)中强调的那样,数据正在向云移动。这正在使用OSS实现,Kubernetes也是如此。因此,DataStax选择Kubernetes来突出它对Apache Cassandra社区的贡献,这并不奇怪。通过Cassandra Kubernetes运营商,DataStax声称企业和用户将拥有一个一致的计算和数据扩展堆栈。问题是:这到底是从哪里来的?它是由DataStax开发的,然后作为一种新方法的有形标志捐赠给社区的吗?DataStax最近招募了一些高管来更新其领导层。切特•卡普尔(Chet Kapoor)和新任首席执行官山姆•兰吉(Sam Ramji)都曾是谷歌员工。在最近的一次采访中,Ramji强调了一些关键领域:重新与OSS社区建立联系,强调服务和支持,让开发人员的生活更加轻松。“我们再次拥抱开源,”McFadin肯定地说。麦克法丁促成了Kubernetes运营商的出现,他在技术和社会层面都发挥了重要作用。Kubernetes看到了一个快速的更新。根据2019年云原生计算基金会(Cloud Native Computing Foundation)的一项调查,78%的受访者在生产中使用Kubernetes,去年这一比例为58%。

DataStax将通过Kubernetes实现云计算和开源。(图片:DataStax)

这意味着不同的组织已经在努力让Kubernetes与Cassandra合作,根据DB引擎,Cassandra是世界上十大最受欢迎的数据库之一。这就是麦克法丁工作的背景。一方面,正如他所指出的,有许多相同事物的实现意味着人们可能在同一页面上,就什么是重要的工作而言。另一方面,集成是一种技术上和社会上的平衡行为。DataStax一直与Sky、Orange、Netflix、Target和Cassandra社区中的许多其他团队合作,以改进和提升运营商。McFadin长期参与OSS,他指出了一个显而易见的事实:每个团队都专注于解决对他们来说最重要的问题。按照McFadin的说法,DataStax解决这个问题的方式不是在GitHub上发布代码,然后指望社区采用它作为与Kubernetes合作的唯一方式。DataStax开发的不仅仅是运营商——还有Kubernetes sidecar和管理API。DataStax使用它来开发自己的云,现在所有人都可以使用它。

DataStax的云管理版本(之前称为Constellation)现在更名为Astra。预计很快就会普及。麦克法丁承认,事实是卡桑德拉有一个强大的声誉,但很难管理。McFadin还提到了即将发布的Cassandra 4.0版本,DataStax公司承诺将为其贡献一份力。他说,这将是迄今为止最好的版本,不是因为它有什么吸引人的新功能,而是因为它的稳定性。谈到云、开源代码和社区时,讨论涉及了一个更广泛的主题。McFadin提到与Cassandra社区和Apache软件基金会(ASF)重新建立联系,这是一种令人谦卑的经历。他说,人们渴望倾听,但为了获得他们的信任,DataStax希望让行动胜于语言。换句话说,DataStax用OSS中最重要的东西——代码来支持它的意图。或者,不是吗?

开源软件的难题有很多。(图片:照片byHans-Peter GausteronUnsplash)

仅仅根据代码来评估和度量贡献并不是考虑OSS的唯一方法。ASF更喜欢社区而不是代码。以代码的形式度量贡献并不是微不足道的,但是它已经被很好地理解了,并且可以完成。但是社区的贡献呢,比如在宣传方面呢?McFadin提到了他自己在DataStax宣传团队的经历。基于此,他提到了一些可以用来衡量社区参与和贡献的指标:研讨会的数量、主题和相关出席率、公共论坛上的问题回答等等。我们以前曾考虑过这样一个主题,即衡量贡献和奖励贡献者是否可能是发展和维持OSS的更公平的方法。麦克法丁没有回答这个问题。然而,他确实指出了一个事实,即健康的OSS社区吸引了许多参与者的贡献,而且是以多种方式。在任何情况下,DataStax都不会考虑更改许可,以阻止云供应商将Cassandra作为服务提供。一个许可的Apache许可和一个商业许可就足够了,McFadin说,如果亚马逊想这样做,那就这样吧。

与社区重新建立联系听起来是一件好事。开源的Cassandra也有更多的功能。然而,对于DataStax,这造成了一种众所周知且不可避免的紧张关系。哪些特性保留在DataStax Enterprise (DSE)中,哪些特性成为开源的Cassandra?McFadin回应说,DataStax不希望它的产品在100%的DataStax商店中使用。他接着补充说,客户不仅重视功能,而且是他们可以依赖的合作伙伴,这正是DataStax希望成为的。最近对TLP的收购也应该从对基于服务的模型的新强调来看待。然而,由于这些重要的主题处于聚光灯下,我们可能会忽略其他一些同样重要的事情:DataStax向多模型数据库的转变。DataStax很久以前就向DSE添加了图形功能。然而,到目前为止,还不可能将本地Cassandra数据和图形数据混合起来。

通过Gremlin向DataStax企业本机数据添加图形查询功能可能是迈向多模型未来的第一步。(图片:Apache Tinkerpop)

从最新发布的DSE 6.8开始,图形查询现在可以利用本地Cassandra数据模型。将数据插入到DSE中可以使用Gremlin进行查询。这使开发人员能够构建具有连接、匹配和遍历分布式大数据集的多模型应用程序。除了增强图形用户的能力之外,这也是“传统”DSE用户的一大胜利。正如McFadin所指出的,很少有开发人员虔诚地致力于一种或另一种数据模型。他们中的大多数人只是想用正确的工具来完成工作。通过允许DSE用户将图形查询功能添加到他们的库中,DSE获得了许多好处。首先,连接的能力。Graph擅长于此,DSE用户将从中受益。然而,也许更重要的是,DataStax向多模型的未来迈出了第一步。为了让Cassandra无处不在,这可能会很有效。