sparksql で emoji/pictogram を含む行を検出する
select text from table where dt='20190911' and text rlike '[\\uD800-\\uDFFF]'
とかでとりあえず良さそう。
Published: 2019-09-13(Fri) 09:07
select text from table where dt='20190911' and text rlike '[\\uD800-\\uDFFF]'
とかでとりあえず良さそう。
Published: 2019-09-13(Fri) 09:07