
Python操作HBase:绕不开的Thrift?
很多Python教程都采用Python -> Thrift -> HBase的模式操作HBase,这让人不禁疑问:为什么非要Thrift做中间层?Python可以直接连接HBase吗?如果可以,有什么缺点?Java、Go、Node.js等其他语言操作HBase也需要Thrift吗?本文将一一解答。
HBase原生客户端基于Java开发。这意味着,Python、PHP、C++等非Java语言无法直接使用HBase原生API。为了让这些语言也能访问HBase,Apache HBase提供了Thrift服务,这是一个跨语言的远程过程调用(RPC)框架。Thrift将HBase接口转换成多种语言可调用的形式,Python通过Thrift客户端库与Thrift服务通信,再由Thrift服务与HBase交互。
所以,Python无法直接连接HBase。直接连接意味着需要从头开发一套完整的HBase客户端,这工作量巨大,而且需要持续维护与HBase版本的兼容性。而使用Thrift,则能充分利用HBase官方提供的Thrift服务,降低开发成本,并保证兼容性。
Java操作HBase通常不需要Thrift。因为Java是HBase原生支持的语言,可以直接使用HBase的Java API,效率更高,也更便捷。
采用HttpClient向服务器端action请求数据,当然调用服务器端方法获取数据并不止这一种。WebService也可以为我们提供所需数据,那么什么是webService呢?,它是一种基于SAOP协议的远程调用标准,通过webservice可以将不同操作系统平台,不同语言,不同技术整合到一起。 实现Android与服务器端数据交互,我们在PC机器java客户端中,需要一些库,比如XFire,Axis2,CXF等等来支持访问WebService,但是这些库并不适合我们资源有限的android手机客户端,
立即学习“Python免费学习笔记(深入)”;
Go、Node.js等其他语言与Python类似,通常也需要通过Thrift访问HBase,因为HBase没有为这些语言提供原生客户端库。它们都需要借助Thrift这个跨语言RPC框架来与HBase通信。









