• leetcode-2-重复的DNA序列


    所有 DNA 都由一系列缩写为 A,C,G 和 T 的核苷酸组成,例如:“ACGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。

    编写一个函数来查找 DNA 分子中所有出现超过一次的 10 个字母长的序列(子串)。

    示例:

    输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
    输出:["AAAAACCCCC", "CCCCCAAAAA"]

    来源:力扣(LeetCode)
    链接:https://leetcode-cn.com/problems/repeated-dna-sequences
    著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

    我这里用的是list,其实用set性能更好,list进行查询是O(logn),而set是O(1)的。

    public List<String> findRepeatedDnaSequences(String s) {
            int len = s.length();
            List<String> res = new ArrayList<String>();
            if (len <= 10) return res;
            Map<String, Integer> all = new HashMap<String, Integer>();
            for (int i = 0; i <= len - 10; i++) {
                String str = s.substring(i, i+10);
                if (all.containsKey(str)) {
                    all.put(str, all.get(str) + 1);
                } else {
                    all.put(str,1);
                }
            }
            for (Map.Entry<String, Integer> stringIntegerEntry : all.entrySet()) {
                if (stringIntegerEntry.getValue() > 1) {
                    res.add(stringIntegerEntry.getKey());
                }
            }
            return res;
        }
    		```
  • 相关阅读:
    ClickHouse 详解
    SparkStreaming(二)--SparkStreaming整合Kafka
    SparkStreaming(一)--核心概念及算子
    毕设进度-3月22日
    毕设进度-3月21日
    毕设进度-3月14日
    毕设进度-3月13日
    毕设进度-3月12日
    毕设进度-3月11日
    毕设进度-3月10日
  • 原文地址:https://www.cnblogs.com/foolgry/p/11795233.html
Copyright © 2020-2023  润新知