Pada kesempatan kali ini, saya akan membagikan pengalaman tentang bagaimana menjalankan Spark SQL Thrift Server menggunakan Beeline. Berikut ini adalah spesifikasi OS dan software yang saya gunakan pada laptop:
1. OS Windows 7 – Home Premium x64.
2. Java SDK 8u121 (JDK 1.8), download di sini.
3. Apache hadoop-2.7.2, download di sini.
4. Apache spark-2.4.3-bin-hadoop2.7, download di sini.
Baik langsung saja kita mulai, pertama kita harus menjalankan Spark SQL Thrift Server, berikut adalah beberapa hal yang perlu dilakukan:
1. Pastikan Java sudah terinstal di OS kalian. Silahkan buka Command Promt (CMD), lalu jalankan perintah java –version:
2. Download hadoop-2.7.2 dan spark-2.4.3-bin-hadoop2.7, kemudian buat folder apache di C:\
3. Extract here file hadoop-2.7.2.tar.gz dan spark-2.4.3-bin-hadoop2.7.tgz di folder C:\apache. Struktur foldernya akan terlihat seperti ini:
4. Tambahkan Environment Variables untuk JAVA_HOME, HADOOP_HOME, dan SPARK_HOME pada bagian System variables. Berikut adalah path yang ada pada laptop saya:
JAVA_HOME : C:\Program Files\Java\jdk1.8.0_121
HADOOP_HOME: C:\apache\hadoop-2.7.2
SPARK_HOME: C:\apache\spark-2.4.3-bin-hadoop2.7
5. Modifikasi variable PATH pada bagian System variables dengan menambahkan value berikut ini:
%HADOOP_HOME%\bin; %JAVA_HOME%\bin;%SPARK_HOME%\bin
6. Buatlah folder C:\tmp\hive.
7. Buka Command Prompt baru, lalu jalankan perintah sebagai berikut:
winutils.exe chmod 777 C:\tmp\hive
8. Untuk memulai Spark SQL Thrift Server, jalankan perintah sebagai berikut:
spark-submit --verbose --class org.apache.spark.sql.hive.thriftserver.HiveThriftServer2 --hiveconf hive.server2.thrift.port=10000 --driver-memory 1g
9. Spark SQL Thrift Server berhasil di jalankan.
Untuk menjalan beeline, silahkan buka Command Prompt baru, dan ikuti intruksi sebagai berikut ini:
1. ketik beeline, lalu tekan enter.
2. Ketik !connect jdbc:hive2://localhost:10000, lalu tekan enter.
3. Kosongkan username dan password (default).
Sampai disini Spark SQL Thrift Server dan Beeline sudah berhasil di jalankan. Silahkan ketikkan perintah show databases; untuk melihat databaseName yang ada.
Terima kasih.


