Joze's Blog

Stay Hungry, Stay Foolish.


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

NLP 笔记(五):分词与词性标注

发表于 2019-05-23 | 分类于 NLP
本文字数: 5.7k | 阅读时长 ≈ 5 分钟

✎知识讲解

✎概述

  • 词法分析的主要任务是词性标注和词义标注
  • 词性是词汇的基本属性。进行词性标注通常有基于规则和基于统计的两种方法。
  • 词性或称词类(Part-of-Speech, POS)是词汇最重要的特性,是连接词汇到句法的桥梁
  • 词义标注的重点就是解决如何确定多义词在具体语境中的义项问题。标注过程中,通常是先确定语境,再明确词义
阅读全文 »

NLP 笔记(四):语言模型

发表于 2019-05-22 | 更新于 2019-05-23 | 分类于 NLP
本文字数: 5.8k | 阅读时长 ≈ 5 分钟

✎知识讲解

自然语言处理的两种基本方法:

  1. 基于规则的分析方法

    • 规则库开发
    • 推导方法设计

    理论基础:形式语言与自动机理论

  2. 基于语料库的统计方法

    • 语料库建设
    • 统计模型建立

    理论基础:数理统计、信息论、语料库

阅读全文 »

Spring 笔记(四):基于注解的 IoC 配置

发表于 2019-05-20 | 更新于 2019-05-25 | 分类于 Spring框架
本文字数: 8.2k | 阅读时长 ≈ 7 分钟

✎前言

注解配置和 xml 配置 bean 对象的特点和实现的功能都是一样的,都是降低程序间的耦合,只是配置的形式不一样。

基于注解整合时,导入约束时需要多导入一个 context 名称空间下的约束。

1
2
3
4
5
6
7
8
9
10
11
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:context="http://www.springframework.org/schema/context"
xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans.xsd
http://www.springframework.org/schema/context
http://www.springframework.org/schema/context/spring-context.xsd">
<!--告知spring在创建容器时要扫描的包,配置所需要的标签不是在beans的约束中,而是一个名称为context名称空间和约束中-->
<context:component-scan base-package="com.ourzh"></context:component-scan>
</beans>
阅读全文 »

Spring 笔记(三):使用 spring 的 IOC 解决程序耦合

发表于 2019-05-18 | 更新于 2019-05-24 | 分类于 Spring框架
本文字数: 11k | 阅读时长 ≈ 10 分钟

✎例子

✎问题

一个程序过度耦合的例子:账户的业务层和持久层的依赖关系;

创建持久层接口和实现类

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
/**
* 账户的持久层接口
*/
public interface AccountDao {
//保存账户
void saveAccount();
}

/**
* 账户的持久层实现类
*/
public class AccountDaoImpl implements AccountDao {
@Override
public void saveAccount() {
System.out.println("保存了账户");
}
}
阅读全文 »

Spring 笔记(二):IoC 概念详解

发表于 2019-05-17 | 更新于 2019-05-18 | 分类于 Spring框架
本文字数: 3.1k | 阅读时长 ≈ 3 分钟

✎程序的耦合

  • 耦合性(Coupling),也叫耦合度,是对模块间关联程度的度量。耦合的强弱取决于模块间接口的复杂性、调用模块的方式以及通过接口传送数据的多少。模块间的耦合度是指模块之间的依赖关系,包括控制关系、调用关系、数据传递关系。模块间联系越多,其耦合性越强,同时表明其独立性越差( 降低耦合性,可以提高其独立性)。 耦合性存在于各个领域,而非软件设计中独有的,但是我们只讨论软件工程中的耦合。
  • 在软件工程中, 耦合指的就是就是对象之间的依赖性。对象之间的耦合越高,维护成本越高。因此对象的设计应使类和构件之间的耦合最小。 软件设计中通常用耦合度和内聚度作为衡量模块独立程度的标准。 划分模块的一个准则就是高内聚,低耦合。
阅读全文 »

Spring 笔记(一):Spring 概述

发表于 2019-05-16 | 更新于 2019-05-18 | 分类于 Spring框架
本文字数: 1.2k | 阅读时长 ≈ 1 分钟

✎Spring 是什么

Spring 是分层的 Java SE/EE 应用 full-stack 轻量级开源框架,以 IoC(Inverse Of Control,反转控制)和 AOP(Aspect Oriented Programming,面向切面编程)为内核,提供了展现层 Spring MVC 和持久层 Spring JDBC 以及业务层事务管理等众多的企业级应用技术,还能整合开源世界众多著名的第三方框架和类库,逐渐成为使用最多的 Java EE 企业应用开源框架。

阅读全文 »

JDBC 详解

发表于 2019-05-16 | 更新于 2019-05-18 | 分类于 Java学习
本文字数: 6.6k | 阅读时长 ≈ 6 分钟

✎JDBC 概述

  • **JDBC(Java DataBase Connectivity,java 数据库连接)**是一种用于执行 SQL 语句的 Java API。JDBC 是 Java 访问数据库的标准规范,可以为不同的关系型数据库提供统一访问,它由一组用 Java 语言编写的接口和类组成。
  • JDBC 需要连接驱动,驱动是两个设备要进行通信,需满足一定通信数据格式,数据格式由设备提供商规定。设备提供商为设备提供驱动软件,通过软件可以与该设备进行通信。
阅读全文 »

NLP 笔记(三):最短编辑距离

发表于 2019-05-09 | 更新于 2019-05-10 | 分类于 NLP
本文字数: 1.6k | 阅读时长 ≈ 1 分钟

✎知识讲解

✎定义

如何衡量两个字符串有多相似?

  • 拼写纠正:用户键入“graffe”,以下哪个最接近?

    • graf
    • graft
    • grail
    • giraffe
阅读全文 »

NLP 笔记(二):基本文字处理

发表于 2019-05-06 | 更新于 2019-05-10 | 分类于 NLP
本文字数: 3.5k | 阅读时长 ≈ 3 分钟

✎知识讲解

✎正则表达式

正则表达式 (Regular Expressions) 是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个规定字符串。

✎基本语法

析取:字符集合[],范围表示[A-Z]

阅读全文 »

NLP 笔记(一):介绍 NLP

发表于 2019-05-06 | 更新于 2019-05-22 | 分类于 NLP
本文字数: 1.4k | 阅读时长 ≈ 1 分钟

✎从语言到信息

✎从语言中提取信息

✎含义

从以下内容自动提取句意和结构:

  • 人类语言文本和演讲(新闻、社交媒体等)
  • 社交网络
  • 基因组序列
阅读全文 »
123
Ruizhi Ou

Ruizhi Ou

记录学习经历
21 日志
7 分类
15 标签
© 2019 Ruizhi Ou | 63k | 57 分钟
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Gemini v7.1.0
0%