文本分类

html - 标签语法

泄露秘密 提交于 2019-11-26 22:48:59
HTML 标签语言 概念    超文本标记语言 ,是一种用于创建网页的标记语言。 ps:   不是编程语言,是利用标签来描述网页的。   扩展名:.html  .htm 语法规范 标签不区分大小写,推荐小写。 双标签必须写完整(浏览器不会报错,而且自动补全,但是最终效果很大可能性影响整体布局)。 不用标签形式的内容会以完整的原内容进行展示。 合理的注释:"<!--注释内容-->"和缩进增加代码的可读性 文档结构 <!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="UTF-8"> <title>css样式优先级</title> </head> <body> </body> </html> 属性说明    <!DOCTYPE html>: 声明为HTML5文档   <html></html>: 是文档的开始标记和结束的标记。是HTML页面的根元素,在它们之间是文档的头部(head)和主体(body)   <head></head>: 定义了HTML文档的开头部分。它们之间的内容不会在浏览器的文档窗口显示。包含了文档的元(meta)数据。   <title></title>: 定义了网页标题,在浏览器标题栏显示   <body></body>: 之间的文本是可见的网页主体内容 标签的分类 分类一   自闭合标签:单标签。  

140种Python标准库、第三方库和外部工具

♀尐吖头ヾ 提交于 2019-11-26 19:38:36
吐血整理!140种Python标准库、第三方库和外部工具都有了 Python那些事 今天 文章转载自公众号 大数据 , 作者 宋天龙 导读: Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方库和工具。 这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。 作者:宋天龙 来源:大数据(ID:hzdashuju) 内容摘编自《Python数据分析与数据化运营》(第2版) 为了区分不同对象的来源和类型,本文将在描述中通过以下方法进行标识: Python内置函数: Python自带的内置函数。函数无需导入,直接使用。例如要计算-3.2的绝对值,直接使用abs函数,方法是 abs( -3.2) Python标准库: Python自带的标准库。Python标准库无需安装,只需要先通过import方法导入便可使用其中的方法。例如导入string模块,然后使用其中的find方法: import string string.find( 'abcde', 'b') 第三方库: Python的第三方库。这些库需要先进行安装(部分可能需要配置)。 外部工具:

文本分类读书笔记

流过昼夜 提交于 2019-11-26 11:34:50
模型发展 NNLM(2003) FastText (2016),基于wordemdding(CBOW、skip-gram):   模型简单简单、快速,直接把句子对应的词向量相加求和平均作为input,用基于霍夫曼树的分层softmaxt。可以作为一个baseline版本模型 TextCNN (2014),基于预训练word2vec模型用于句子的分类任务。 CNN通过多个不同filter 、size的卷积核做特征检测,得到多个特征映射feature map,然后再通过pooling对检测的特征进行筛选,过滤噪音,提取关键信息,用于文本的分类。 DCNN (2014) 动态卷积网络 GCNN (2017) 基于gate的CNN   CNN的本质是通过卷积运算和池化操作提取关键信息,比较擅长捕获原始语料的局部特征。   RNN:Recurrent,模型对每个元素执行相同的操作,当前时刻的计算依赖上一个时刻的计算结果。网络具有”记忆“功能      RNN因为是个序列模型,因此更加擅长时序信息和长距离的依赖。RNN比较符合人类语音的特性,理解文章每一个词都是基于前面已经看过读过的词。    模型举例 LSTM Bi-LSTM:双向LSTM Seq2Seq:decoder encoder 机器翻译 Attation Seq2Seq (引入注意力机制) 语言模型:对一个文本序列

全栈笔记-前端-第一部分:HTML5+CSS3-03-HTML5的基本结构(下)-常用标签分类和介绍

倾然丶 夕夏残阳落幕 提交于 2019-11-26 10:32:53
一,前言 首先要说一下,距离上一篇全栈笔记的更新大概有半个月了 这段时间基于Vue-cli3和Ant-Design-Vue做了一个后台管理的Demo 我也想把这个思考学习的过程记录下来,所以在博客和Git上对整个过程做了记录 一步一步实现一个开箱即用的后台管理平台模板,功能完备之后再对各部分做优化 回过头来继续说<<全栈笔记>>,上一篇的HTML5的基本结构(上) 详细介绍了:HTML的基本组成,DOCTYPE文档声明,Title标题和meta元信息 本篇HTML5的基本结构(下),主要针对"HTML文件的内容区"即<body></body>部分 介绍日常开发中高频,重要的标签及语义,也作为后续HTML部分的总览 二,常用标签分类 分类 功能 网站结构类标签 用于创建HTML文件 文件引入类标签 用于引入外部文件,为标签添加样式 布局类标签 用于实现网页整体布局 段落文本类标签 用于实现单行布局 表格类标签 用于制作表格 表单类标签 制作表单 链接&图片类标签 添加锚点和图片应用 低频标签 较少使用 三,网页结构类标签 标签 语义 html 网页文档,用于包含HTML文件 body 网页主体/内容区 head 网页头部 meta 网页元信息 title 网页标题 四,文件引入类标签 标签 语义 link 通过网页外部链接,将外部文件,如:CSS等,引入当前文件 style 网页样式