• 招商动态
招商实践技巧
  • 网络招商的原理和细节(十二)
作者:徐鹏时间:2013年11月01日
  •   

    上篇小易跟大家讲过,想利用大数据来服务于招商的情报搜集和整理必须建设一个先进的数据库,为什么呢?这里要先解释一下,原来我们常用的数据库是关系型数据库,也是结构化数据库,其特点就是存储能力有限、可扩展性差、不支持非结构化数据。最典型的就是视频音频等多媒体文件,在老数据库中,是没有办法和文字等信息放在一起处理的。

    为了让大家更好的理解这个问题,我们可以试举一例。假如某个先进的技术项目,正处于商业化运作的前期。如果这个信息掌握不够及时或者不精确,就有可能被其他园区抢占先机。所以,我们必须要依靠大数据手段挖掘出来。但挖掘本身就要用到数据库,因此海量的原始数据包括新闻、论文、专利申请,甚至视频、图片、PPT等等都要进入数据库等待挖掘。但是,如果依托关系型数据库,之前的库结构中没有这个细分的行业分类,也没有非结构化数据的存储和整理手段,那么新的信息压根就进不了数据库中,更谈不上挖掘。

    就算有幸通过其他渠道获知了此项目,同时又新建了数据库去存储。在项目评估上也会遇到麻烦。因为在高新技术项目评估中涉及的参数很多,需要深入行业技术才能掌握。还有的参数属于模糊定义,比如可以市场化,经济效益明显等类似自然语言的评估,这显然不是关系型数据库所能胜任的。

    总之,在项目招商上,基于关系型数据库的信息处理方式已经落后于时代。如果不加以改进,项目招商也会逐渐演变成劳动力密集型行业,而且考虑到行业细分和技术发展,这种劳动力密集型工作的从业人员队伍很难建设,不容易复制和扩充。

    有鉴于此,新型数据库加上大数据手段才是未来项目招商领域的发展方向。但是,新型数据库到底具有哪些优势呢?如何克服现有的困难?我们先看看新型数据库的一些基本特征。

    如今正在快速发展的新型数据库是分布型非关系型数据库(NoSQL),它抛弃了关系数据库复杂的关系操作、事务处理等功能,仅提供简单的键值对(Key,Value)数据的存储与查询,换取高扩展性和高性能,满足论坛、博客、SNS、微博等互联网类应用场景下针对海量数据的操作需求。

    伴随这种新型数据库还有一些处理工具,例如针对文字信息的分词技术,能够将一些自然语言转变成可被计算机处理的键值;针对图片和视频信息的图片、视频区分技术;针对语音的语音识别技术;能够抓取海量信息的爬虫技术。

    NoSQL数据库加上分词、爬虫、语音识别、图片视频识别等技术,就构成了新一代项目招商信息平台的利器。在整套体系的支持下,我们无需建立庞大的信息搜集队伍,也无需将这抓取的庞大信息逐一定义归类。只需要定期或者不定期的生成项目列表和目标园区列表,然后定点攻关就可以了。

    好了,小易跟大家分享了一些大数据和数据库方面对于招商的支持,随着互联网技术的发展,人与人、人与信息之间还有更多的沟通联系方式。在未来,可能还会涌现出更多的招商工具为我们所用。只要拥有好奇心和探索欲望,未来工作肯定会更高效。