• keras实现textcnn


    https://github.com/MoyanZitto/keras-cn/blob/master/docs/legacy/blog/word_embedding.md  这个链接将带有embeding层的cnn实现及训练的过程讲的很清楚
    构建好带有embedding层的textcnn模型后,model.fit时传入的x_train是二维的要训练的词对应的标号。下面的代码会将词进行标号。

    import keras.preprocessing.text as T
    from keras.preprocessing.text import Tokenizer

    text1 = 'some/thing to eat'
    text2 = 'some thing to drink'
    texts = [text1, text2]
    print(' '.join(text1.split('/')))
    tokenizer = Tokenizer(num_words=None) # num_words:None或整数,处理的最大单词数量。少于此数的单词丢掉
    tokenizer.fit_on_texts(texts)
    sequences = tokenizer.texts_to_sequences(texts)
    print(sequence)
    word_index = tokenizer.word_index
    data = pad_sequences(sequences, maxlen=10)
    print(data)
    print('Found %s unique tokens.' % len(word_index))
    print(tokenizer.word_counts) # [('some', 2), ('thing', 2), ('to', 2), ('eat', 1), ('drink', 1)]
    print(tokenizer.word_index) # {'some': 1, 'thing': 2,'to': 3 ','eat': 4, drink': 5}
    print(tokenizer.word_docs) # {'some': 2, 'thing': 2, 'to': 2, 'drink': 1, 'eat': 1}
    print(tokenizer.index_docs)
  • 相关阅读:
    jQuery——能够编辑的表格
    最简单的Windows程序
    数据库分页查询
    Srvctl命令具体解释(10g)
    AT3912 Antennas on Tree
    使用GenericServlet实例
    Servlet接口、GenericServlet类、HttpServlet类
    Servlet简介
    MVC
    为JSP写的一套核心标签
  • 原文地址:https://www.cnblogs.com/kjkj/p/10528244.html
Copyright © 2020-2023  润新知