Một đoạn SQL nhất định cần phân tích chuỗi json trong một trường. Tuy nhiên, các ký tự tiếng Trung trong đó cũng được mã hóa và lưu trữ ở định dạng tương tự.
u6e38u620f
Câu lệnh SQL về mặt lý thuyết như sau
get_json_object(extends,'$.cate')='u6e38u620f'
Tuy nhiên, việc thực thi hệ thống thực tế bao gồm các lớp của quá trình biên dịch. Cần viết bao nhiêu dấu gạch chéo ngược để chọn kết quả chính xác?
Các kết luận thực nghiệm như sau:
hiện hữu
spark-hive>
Trong trường hợp này, chỉ cần nhập hai dấu gạch chéo ngược
spark-hive> ……get_json_object(extends,'$.cate')='\u6e38\u620f'……
Nếu sử dụng
spark-hive -e "" > out.txt
Để thực thi, bạn cần nhập bốn dấu gạch chéo ngược
spark-hive -e "……get_json_object(extends,'$.cate')='\\u6e38\\u620f'……" > out.txt