一个计算机技术爱好者与学习者

0%

前言

《在Ubuntu16.04上安装Hadoop》一文中,搭建好了hadoop平台。
接下来,我们参照慕课网Kit_Ren的《Hadoop大数据平台架构与实践——基础篇》教程,跑一下单词计数程序。

要求:计算文件中出现每个单词的频数,输入结果按照字母顺序进行排序。
输入:

1
2
3
hello world bye world
hello hadoop bye hadoop
bye hadoop hello hadoop

输出:

1
2
3
4
bye     3
hello 3
hadoop 4
world 2
阅读全文 »

mysql5.6设置密码

通过修改表数据设置密码

一般mysql的root默认密码为空,如果之前没有设置过root密码,我们可以使用空密码登录后设置密码。

1、启动mysql

1
service start mysql

2、进入mysql控制台

1
mysql -u root

3、修改密码

1
2
3
use mysql;
update mysql.user set password=password('voidking') where user='root';
exit;

4、重启mysql服务

1
service mysqld restart

5、测试登录

1
mysql -u root -p
阅读全文 »

什么是大数据?

什么是大数据?正如字面意思,大量的数据。举个例子,Mysql的一张表里存了1万条数据,查询没问题;100万条数据,查询也没问题;那么,1亿条数据?100亿条数据?更大的数据?

大数据科学家JohnRauser提到一个简单的定义:大数据就是任何超过了一台计算机处理能力的庞大数据量。

为了处理大量的数据,我们必须找到更好的办法。谷歌经过研究,发表了一些关于大数据解决方案的论文,涉及MapReduce、BigTable、GFS等。但是,谷歌开发的大数据处理平台,并没有开源。一些勤奋的同学根据谷歌发表的论文,搞出了Hadoop平台,后来成为一个主流的大数据处理平台。

参考文档:

阅读全文 »

所谓开放平台,就是首先提供一个基本的服务,然后通过开放自身的接口,使得第三方开发者得以通过运用和组装其接口以及其他第三方服务接口产生新的应用,并且使得该应用能够统一运行在这个平台之上,我们把这样的一种网络服务模式叫做开放平台。开放平台模式成功的要点在于,通过自身服务和第三方应用的互利互惠,提高用户对平台网站的粘性和使用程度,进而提高获利,同时,通过利益分摊,达到平台自身和第三方应用循环刺激而产生的滚雪球式的增长。麦布收集了最新最全的开放平台注册应用,用得着就收藏了吧。

阅读全文 »