zhangqian
2023-11-17 844f645172ebde7e94307004647e4a41f71030be
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
package blevex
 
import (
    "github.com/blevesearch/bleve/v2"
    "github.com/blevesearch/bleve/v2/mapping"
    "github.com/yanyiwu/gojieba"
    "sync"
)
 
// InitAnalyzer 加载自定义分词器(结巴分词)
 
var defaultAnalyzer *mapping.IndexMappingImpl
 
func InitAnalyzer() {
    indexMapping := bleve.NewIndexMapping()
    //os.RemoveAll(IndexDir)
    //// clean index when example finished
    //defer os.RemoveAll(IndexDir)
 
    err := indexMapping.AddCustomTokenizer("gojieba",
        map[string]interface{}{
            "dictpath":     gojieba.DICT_PATH,
            "hmmpath":      gojieba.HMM_PATH,
            "userdictpath": gojieba.USER_DICT_PATH,
            "idf":          gojieba.IDF_PATH,
            "stop_words":   gojieba.STOP_WORDS_PATH,
            "type":         "gojieba",
        },
    )
    if err != nil {
        panic(err)
    }
    err = indexMapping.AddCustomAnalyzer("gojieba",
        map[string]interface{}{
            "type":      "gojieba",
            "tokenizer": "gojieba",
        },
    )
    if err != nil {
        panic(err)
    }
    indexMapping.DefaultAnalyzer = "gojieba"
    defaultAnalyzer = indexMapping
}
 
var indexMap sync.Map
 
func NewIndex(indexName string) (bleve.Index, error) {
    if defaultAnalyzer == nil {
        InitAnalyzer()
    }
    index, err := bleve.New(indexName, defaultAnalyzer)
    if err == bleve.ErrorIndexPathExists {
        index, err = bleve.Open(indexName)
        if err != nil {
            return nil, err
        }
        return index, nil
    } else if err != nil {
        return nil, err
    }
    return index, nil
}
 
func LoadIndex(indexName string) (bleve.Index, error) {
    if v, ok := indexMap.Load(indexName); ok {
        return v.(bleve.Index), nil
    }
    index, err := NewIndex(indexName)
    if err == nil {
        indexMap.Store(indexName, index)
    }
    return index, err
}
func Search(indexName string, keyword string) (ids []string, err error) {
    index, err := LoadIndex(indexName)
    if err != nil {
        return nil, err
    }
    req := bleve.NewSearchRequest(bleve.NewQueryStringQuery(keyword))
    res, err := index.Search(req)
    if err != nil {
        panic(err)
    }
    if res == nil || res.Total == 0 {
        return ids, nil
    }
    for _, ret := range dealResult(res) {
        ids = append(ids, ret.Id)
    }
    return ids, nil
}
 
type Result struct {
    Id    string  `json:"id"`
    Score float64 `json:"score"`
}
 
func dealResult(res *bleve.SearchResult) []Result {
    var results []Result
    for _, item := range res.Hits {
        results = append(results, Result{item.ID, item.Score})
    }
    return results
}