ICTCLAS tags them as "i" (idiom)
使用ICTCLAS、东北大学分词器、或者海量分词工具等工具进行分词赋码后只能得到这些分词工具词典里已有的短语或成语,对于分词工具中没有收集的短语则无能为力。要拿到全部可能的四字短语,可以考虑使用N-gram工具来自动提取。下面的链接里有几个免费的n-gram工具。不过,由于这些工具都是为处理英文文本开发的,要处理中文文本,注意先要把汉语文本每个汉字前加空格。
http://www.corpus4u.org/showthread.php?t=3489