甜果果2333

ACL 2022 主会长文论文分类整理

导读

ACL 2022是CCF A类会议，人工智能领域自然语言处理（Natural Language Processing，NLP）方向最权威的国际会议之一。第60届计算语言学协会计划于今年5月22日-5月27日在爱尔兰都柏林召开。官方发布的接收论文列表：

Accepted Papers

(https://www.2022.aclweb.org/papers)

目录
- Adversarial attack and Robustness【对抗攻击和鲁棒性】
- Dialogue and Interactive Systems【对话与交互系统】
- Discourse and Pragmatics【语篇和语用学】
- Data Augmentation【数据增广】
- Generation【文本生成】
- Information Extraction【信息抽取】
- Information Retrieval and Text Mining【信息检索与文本挖掘】
- Interpretability and Analysis of Models for NLP【NLP模型的可解释性与分析】
- Language Model【语言模型】
- Machine Learning for NLP【NLP中的机器学习】
- Machine Translation and Multilinguality【机器翻译与多语】
- Question Answering【问答与理解】
- Resources and Evaluation【数据集与评估方法】
- Sentence-level Semantics, Textual Classification, and Other Areas【句子级语义和文本关系推理】
- Semantics and Syntax Parsing【语义与句法解析】
- Speech and Multimodality【语音与多模态】
- Summation【摘要】
- Knowledge Graph【知识图谱】
- Special Track【特殊任务】

Adversarial attack and Robustness【对抗攻击和鲁棒性】

Adversarial Authorship Attribution for Deobfuscation

Adversarial Soft Prompt Tuning for Cross-Domain Sentiment Analysis

Flooding-X: Improving BERT's Resistance to Adversarial Attacks via LossRestricted Fine-Tuning

From the Detection of Toxic Spans in Online Discussions to the Analysis of Toxic-to-Civil Transfer

Imputing Out-of-Vocabulary Embeddings with LOVE Makes Language Models Robust with Little Cost

ParaDetox: Detoxification with Parallel Data

Pass off Fish Eyes for Pearls: Attacking Model Selection of Pre-trained Models

SHIELD: Defending Textual Neural Networks against Multiple Black-Box

Adversarial Attacks with Stochastic Multi-Expert Patcher

Towards Robustness of Text-to-SQL Models Against Natural and Realistic Adversarial Table Perturbation

ToxiGen: A Large-Scale Machine-Generated Dataset for Adversarial and Implicit Hate Speech Detection

Dialogue and Interactive Systems【对话与交互系统】

A Model-agnostic Data Manipulation Method for Persona-based Dialogue Generation

A Taxonomy of Empathetic Questions in Social Dialogs

Achieving Conversational Goals with Unsupervised Post-hoc Knowledge Injection

Achieving Reliable Human Assessment of Open-Domain Dialogue Systems

An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation

Beyond Goldfish Memory: Long-Term Open-Domain Conversation

Beyond the Granularity: Multi-Perspective Dialogue Collaborative Selection for Dialogue State Tracking

CASPI Causal-aware Safe Policy Improvement for Task-oriented Dialogue

ChatMatch: Evaluating Chatbots by Autonomous Chat Tournaments

CICERO: A Dataset for Contextualized Commonsense Inference in Dialogues

Contextual Fine-to-Coarse Distillation for Coarse-grained Response Selection in Open-Domain Conversations

Continual Prompt Tuning for Dialog State Tracking

DEAM: Dialogue Coherence Evaluation using AMR-based Semantic Manipulations

DialogVED: A Pre-trained Latent Variable Encoder-Decoder Model for Dialog Response Generation

Dynamic Schema Graph Fusion Network for Multi-Domain Dialogue State Tracking

GlobalWoZ: Globalizing MultiWoZ to Develop Multilingual Task-Oriented Dialogue Systems

HeterMPC: A Heterogeneous Graph Neural Network for Response Generation in Multi-Party Conversations

Improving Multi-label Malevolence Detection in Dialogues through Multifaceted Label Correlation Enhancement

Interactive Word Completion for Plains Cree

Internet-Augmented Dialogue Generation

Knowledge Enhanced Reflection Generation for Counseling Dialogues

M3ED: Multi-modal Multi-scene Multi-label Emotional Dialogue Database

MISC: A Mixed Strategy-Aware Model integrating COMET for Emotional Support Conversation

Multi-Party Empathetic Dialogue Generation: A New Task for Dialog Systems

Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System

Multimodal Dialogue Response Generation

Online Semantic Parsing for Latency Reduction in Task-Oriented Dialogue

Other Roles Matter! Enhancing Role-Oriented Dialogue Summarization via Role Interactions

ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation

QAConv: Question Answering on Informative Conversations

SaFeRDialogues: Taking Feedback Gracefully after Conversational Safety Failures

SafetyKit: First Aid for Measuring Safety in Open-domain Conversational Systems

SalesBot: Transitioning from Chit-Chat to Task-Oriented Dialogues

Should a Chatbot be Sarcastic? Understanding User Preferences Towards Sarcasm Generation

Situated Dialogue Learning through Procedural Environment Generation

Structural Characterization for Dialogue Disentanglement

The AI Doctor Is In: A Survey of Task-Oriented Dialogue Systems for Healthcare Applications

There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory

Think Before You Speak: Explicitly Generating Implicit Commonsense Knowledge for Response Generation

UniTranSeR: A Unified Transformer Semantic Representation Framework for Multimodal Task-Oriented Dialog System

What does the sea say to the shore? A BERT based DST style approach for speaker to dialogue attribution in novels

Where to Go for the Holidays: Towards Mixed-Type Dialogs for Clarification of User Goals

Speaker Information Can Guide Models to Better Inductive Biases: A Case Study On Predicting Code-Switching

Discourse and Pragmatics【语篇和语用学】

CoCoLM: Complex Commonsense Enhanced Language Model with Discourse Relations

Context Matters: A Pragmatic Study of PLMs’ Negation Understanding

Learning to Mediate Disparities Towards Pragmatic Communication

Modeling Persuasive Discourse to Adaptively Support Students' Argumentative Writing

Neural reality of argument structure constructions

Probing for Predicate Argument Structures in Pretrained Language Models

RST Discourse Parsing with Second-Stage EDU-Level Pre-training

Data Augmentation【数据增广】

An Investigation of the (In)effectiveness of Counterfactually Augmented Data

CipherDAug: Ciphertext based Data Augmentation for Neural Machine Translation

Continual Few-shot Relation Learning via Embedding Space Regularization and Data Augmentation

Deduplicating Training Data Makes Language Models Better

FlipDA: Effective and Robust Data Augmentation for Few-Shot Learning

Generating Data to Mitigate Spurious Correlations in Natural Language Inference Datasets

Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation

MELM: Data Augmentation with Masked Entity Language Modeling for LowResource NER

PromDA: Prompt-based Data Augmentation for Low-Resource NLU Tasks

Synthetic Question Value Estimation for Domain Adaptation of Question Answering

Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data

Generation【文本生成】

A Token-level Reference-free Hallucination Detection Benchmark for Freeform Text Generation

A Well-Composed Text is Half Done! Composition Sampling for Diverse Conditional Generation

Accurate Online Posterior Alignments for Principled Lexically-Constrained Decoding

Active Evaluation: Efficient NLG Evaluation with Few Pairwise Comparisons

AraT5: Text-to-Text Transformers for Arabic Language Generation

Continual Sequence Generation with Adaptive Compositional Modules

Controllable Dictionary Example Generation: Generating Example Sentences for Specific Targeted Audiences

CTRLEval: An Unsupervised Reference-Free Metric for Evaluating Controlled Text Generation

Few-shot Controllable Style Transfer for Low-Resource Multilingual Settings

Fine-Grained Controllable Text Generation Using Non-Residual Prompting

Flexible Generation from Fragmentary Linguistic Input

FrugalScore: Learning Cheaper, Lighter and Faster Evaluation Metrics for Automatic Text Generation

Generating Scientific Definitions with Controllable Complexity

Hierarchical Sketch Induction for Paraphrase Generation

How Do Seq2Seq Models Perform on End-to-End Data-to-Text Generation?

Hybrid Semantics for Goal-Directed Natural Language Generation

Improving Compositional Generalization with Self-Training for Data-to-Text Generation

Improving Personalized Explanation Generation through Visualization

Inducing Positive Perspectives with Text Reframing

latent-GLAT: Glancing at Latent Variables for Parallel Text Generation

Lexical Knowledge Internalization for Neural Dialog Generation

Mix and Match: Learning-free Controllable Text Generationusing Energy Language Models

Multitasking Framework for Unsupervised Simple Definition Generation

Neural Pipeline for Zero-Shot Data-to-Text Generation

Non-neural Models Matter: a Re-evaluation of Neural Referring Expression Generation Systems

ODE Transformer: An Ordinary Differential Equation-Inspired Model for Sequence Generation

Overlap-based Vocabulary Generation Improves Cross-lingual Transfer Among Related Languages

PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation

Predicate-Argument Based Bi-Encoder for Paraphrase Identification

Principled Paraphrase Generation with Parallel Corpora

Quality Controlled Paraphrase Generation

Rare Tokens Degenerate All Tokens: Improving Neural Text Generation via Adaptive Gradient Gating for Rare Token Embeddings

RoMe: A Robust Metric for Evaluating Natural Language Generation

Semi-Supervised Formality Style Transfer with Consistency Training

So Different Yet So Alike! Constrained Unsupervised Text Style Transfer

Spurious Correlations in Reference-Free Evaluation of Text Generation

Tailor: Generating and Perturbing Text with Semantic Controls

Towards Better Characterization of Paraphrases

Uncertainty Determines the Adequacy of the Mode and the Tractability of Decoding in Sequence-to-Sequence Models

An Imitation Learning Curriculum for Text Editing with Non-Autoregressive Models

Understanding Iterative Revision from Human-Written Text

Information Extraction【信息抽取】

Alignment-Augmented Consistent Translation for Multilingual Open Information Extraction

Automatic Error Analysis for Document-level Information Extraction

BenchIE: A Framework for Multi-Faceted Fact-Based Open Information Extraction Evaluation

Dynamic Global Memory for Document-level Argument Extraction

Dynamic Prefix-Tuning for Generative Template-based Event Extraction

FaVIQ: FAct Verification from Information-seeking Questions

FormNet: Structural Encoding beyond Sequential Modeling in Form Document Information Extraction

Generating Scientific Claims for Zero-Shot Scientific Fact Checking

JointCL: A Joint Contrastive Learning Framework for Zero-Shot Stance Detection

KNN-Contrastive Learning for Out-of-Domain Intent Classification

Legal Judgment Prediction via Event Extraction with Constraints

MILIE: Modular & Iterative Multilingual Open Information Extraction

Modeling U.S. State-Level Policies by Extracting Winners and Losers from Legislative Texts

OIE@OIA: an Adaptable and Efficient Open Information Extraction Framework

Packed Levitated Marker for Entity and Relation Extraction

Pre-training to Match for Unified Low-shot Relation Extraction

Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction

Retrieval-guided Counterfactual Generation for QA

Right for the Right Reason: Evidence Extraction for Trustworthy Tabular Reasoning

Saliency as Evidence: Event Detection with Trigger Saliency Attribution

Text-to-Table: A New Way of Information Extraction

Toward Interpretable Semantic Textual Similarity via Optimal Transportbased Contrastive Sentence Learning

Transkimmer: Transformer Learns to Layer-wise Skim

Unified Structure Generation for Universal Information Extraction

Information Retrieval and Text Mining【信息检索与文本挖掘】

Automatic Identification and Classification of Bragging in Social Media

Bilingual alignment transfers to multilingual alignment for unsupervised parallel text mining

Can Unsupervised Knowledge Transfer from Social Discussions Help Argument Mining?

ClarET: Pre-training a Correlation-Aware Context-To-Event Transformer for Event-Centric Generation and Classification

Cross-Lingual Phrase Retrieval

Learning to Rank Visual Stories From Human Ranking Data

Multi-View Document Representation Learning for Open-Domain Dense Retrieval

New Intent Discovery with Pre-training and Contrastive Learning

Pre-training and Fine-tuning Neural Topic Model: A Simple yet Effective Approach to Incorporating External Knowledge

RELiC: Retrieving Evidence for Literary Claims

Retrieval-guided Counterfactual Generation for QA

SDR: Efficient Neural Re-ranking using Succinct Document Representation

Sentence-aware Contrastive Learning for Open-Domain Passage Retrieval

Show Me More Details: Discovering Hierarchies of Procedures from Semistructured Web Data

Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data

UCTopic: Unsupervised Contrastive Learning for Phrase Representations and Topic Mining

Unsupervised Corpus Aware Language Model Pre-training for Dense Passage Retrieval

Zoom Out and Observe: News Environment Perception for Fake News Detection

Interpretability and Analysis of Models for NLP【NLP模型的可解释性与分析】

A Closer Look at How Fine-tuning Changes BERT

A Comparative Study of Faithfulness Metrics for Model Interpretability Methods

A Comparison of Strategies for Source-Free Domain Adaptation

Active Evaluation: Efficient NLG Evaluation with Few Pairwise Comparisons

Adaptive Testing and Debugging of NLP Models

An Empirical Study of Memorization in NLP

An Empirical Study on Explanations in Out-of-Domain Settings

An Empirical Survey of the Effectiveness of Debiasing Techniques for Pretrained Language Models

An Investigation of the (In)effectiveness of Counterfactually Augmented Data

Can Explanations Be Useful for Calibrating Black Box Models?

Can Pre-trained Language Models Interpret Similes as Smart as Human?

Can Prompt Probe Pretrained Language Models? Understanding the Invisible Risks from a Causal View

Can Synthetic Translations Improve Bitext Quality?

Can Transformer be Too Compositional? Analysing Idiom Processing in Neural Machine Translation

Causal Probing for Grammatical Number: From Encoding to Usage

Coherence boosting: When your pretrained language model is not paying enough attention

Context Matters: A Pragmatic Study of PLMs’ Negation Understanding

Cross-Lingual Ability of Multilingual Masked Language Models: A Study of Language Structure

Dataset Geography: Mapping Language Data to Language Users

Do Transformer Models Show Similar Attention Patterns to Task-Specific Human Gaze?

Does Recommend-Revise Produce Reliable Annotations? An Analysis on Missing Instances in DocRED

Explanation Graph Generation via Pre-trained Language Models: An Empirical Study with Contrastive Learning

Finding Structural Knowledge in Multimodal-BERT

Generating Biographies on Wikipedia: The Impact of Gender Bias on the Retrieval-Based Generation of Women Biographies

GPT-D: Inducing Dementia-related Linguistic Anomalies by Deliberate Degradation of Artificial Neural Language Models

How can NLP Help Revitalize Endangered Languages? A Case Study and Roadmap for the Cherokee Language

ILDAE: Instance-Level Difficulty Analysis of Evaluation Data

IMPLI: Investigating NLI Models' Performance on Figurative Language

Improving Generalizability in Implicitly Abusive Language Detection with Concept Activation Vectors

Interpretability for Language Learners Using Example-Based Grammatical Error Correction

Interpreting Character Embeddings With Perceptual Representations: The Case of Shape, Sound, and Color

Investigating Failures of Automatic Translation in the Case of Unambiguous Gender

Investigating Non-local Features for Neural Constituency Parsing

Is Attention Explanation? An Introduction to the Debate

Life after BERT: What do Other Muppets Understand about Language?

Low-Rank Softmax Can Have Unargmaxable Classes in Theory but Rarely in Practice

Measuring Fairness of Text Classifiers via Prediction Sensitivity

Memorisation versus Generalisation in Pre-trained Language Models

Metaphors in Pre-Trained Language Models: Probing and Generalization Across Datasets and Languages

On the Sensitivity and Stability of Model Interpretations in NLP

Pretraining with Artificial Language: Studying Transferable Knowledge in Language Models

Probing as Quantifying Inductive Bias

Probing Simile Knowledge from Pre-trained Language Models

ProtoTEx: Explaining Model Decisions with Prototype Tensors

Reports of personal experiences and stories in argumentation: datasets and analysis

Rewire-then-Probe: A Contrastive Recipe for Probing Biomedical Knowledge of Pre-trained Language Models

Sense Embeddings are also Biased -- Evaluating Social Biases in Static and Contextualised Sense Embeddings

Signal in Noise: Exploring Meaning Encoded in Random Character Sequences with Character-Aware Language Models

Systematic Inequalities in Language Technology Performance across the World’s Languages

That Is a Suspicious Reaction!: Interpreting Logits Variation to Detect NLP Adversarial Attacks

The Dangers of Underclaiming: Reasons for Caution When Reporting How NLP Systems Fail

The Moral Debater: A Study on the Computational Generation of Morally Framed Arguments

The Paradox of the Compositionality of Natural Language: A Neural Machine Translation Case Study

Things not Written in Text: Exploring Spatial Commonsense from Visual Signals

Toward Interpretable Semantic Textual Similarity via Optimal Transportbased Contrastive Sentence Learning

Transformers in the loop: Polarity in neural models of language

Upstream Mitigation Is Not All You Need: Testing the Bias Transfer Hypothesis in Pre-Trained Language Models

When did you become so smart, oh wise one?! Sarcasm Explanation in Multi-modal Multi-party Dialogues

Where to Go for the Holidays: Towards Mixed-Type Dialogs for Clarification of User Goals

Which side are you on? Insider-Outsider classification in conspiracy theoretic social media

Word Order Does Matter and Shuffled Language Models Know It

Language Model【语言模型】

模型结构

ABC: Attention with Bounded-memory Control

AdapLeR: Speeding up Inference by Adaptive Length Reduction

AlephBERT: Language Model Pre-training and Evaluation from Sub-Word to Sentence Level

Better Language Model with Hypernym Class Prediction

CAMERO: Consistency Regularized Ensemble of Perturbed Language Models with Weight Sharing

ClarET: Pre-training a Correlation-Aware Context-To-Event Transformer for Event-Centric Generation and Classification

ClusterFormer: Neural Clustering Attention for Efficient and Effective Transformer

Dependency-based Mixture Language Models

E-LANG: Energy-Based Joint Inferencing of Super and Swift Language Models

EPT-X: An Expression-Pointer Transformer model that generates eXplanations for numbers

Exploring and Adapting Chinese GPT to Pinyin Input Method

Few-Shot Tabular Data Enrichment Using Fine-Tuned Transformer Architectures

Fine- and Coarse-Granularity Hybrid Self-Attention for Efficient BERT

FORTAP: Using Formulas for Numerical-Reasoning-Aware Table Pretraining

Fully Hyperbolic Neural Networks

GLM: General Language Model Pretraining with Autoregressive Blank Infilling

infty-former: Infinite Memory Transformer

KinyaBERT: a Morphology-aware Kinyarwanda Language Model

Knowledge Neurons in Pretrained Transformers

LiLT: A Simple yet Effective Language-Independent Layout Transformer for Structured Document Understanding

Long-range Sequence Modeling with Predictable Sparse Attention

Low-Rank Softmax Can Have Unargmaxable Classes in Theory but Rarely in Practice

Making Transformers Solve Compositional Tasks

Pyramid-BERT: Reducing Complexity via Successive Core-set based Token Selection

SkipBERT: Efficient Inference with Shallow Layer Skipping

Sparsifying Transformer Models with Trainable Representation Pooling

StableMoE: Stable Routing Strategy for Mixture of Experts

TableFormer: Robust Transformer Modeling for Table-Text Encoding

Transkimmer: Transformer Learns to Layer-wise Skim

训练策略

The Trade-offs of Domain Adaptation for Neural Language Models

A Simple Hash-Based Early Exiting Approach For Language Understanding and Generation

Feeding What You Need by Understanding What You Learned

Distinguishing Non-natural from Natural Adversarial Samples for More Robust Pre-trained Language Model

Training Data is More Valuable than You Think: A Simple and Effective Method by Retrieving from Training Data

ELLE: Efficient Lifelong Pre-training for Emerging Data

LinkBERT: Pretraining Language Models with Document Links

CoCoLM: Complex Commonsense Enhanced Language Model with Discourse Relations

Coherence boosting: When your pretrained language model is not paying enough attention

Feeding What You Need by Understanding What You Learned

LinkBERT: Pretraining Language Models with Document Links

MarkupLM: Pre-training of Text and Markup Language for Visually Rich Document Understanding

Sparse Progressive Distillation: Resolving Overfitting under Pretrain-andFinetune Paradigm

Token Dropping for Efficient BERT Pretraining

XLM-E: Cross-lingual Language Model Pre-training via ELECTRA

模型压缩

Compression of Generative Pre-trained Language Models via Quantization

BERT Learns to Teach: Knowledge Distillation with Meta Learning

Multi-Granularity Structural Knowledge Distillation for Language Model Compression

Structured Pruning Learns Compact and Accurate Models

微调策略

A Closer Look at How Fine-tuning Changes BERT

A Good Prompt Is Worth Millions of Parameters: Low-resource Promptbased Learning for Vision-Language Models

Adversarial Soft Prompt Tuning for Cross-Domain Sentiment Analysis

An Information-theoretic Approach to Prompt Engineering Without Ground Truth Labels

Are Prompt-based Models Clueless?

bert2BERT: Towards Reusable Pretrained Language Models

CogTaskonomy: Cognitively Inspired Task Taxonomy Is Beneficial to Transfer Learning in NLP

Composable Sparse Fine-Tuning for Cross-Lingual Transfer

ConTinTin: Continual Learning from Task Instructions

Cross-Task Generalization via Natural Language Crowdsourcing Instructions

Efficient Unsupervised Sentence Compression by Fine-tuning Transformers with Reinforcement Learning

Enhancing Cross-lingual Natural Language Inference by Prompt-learning from Cross-lingual Templates

Fantastically Ordered Prompts and Where to Find Them: Overcoming FewShot Prompt Order Sensitivity

Few-Shot Learning with Siamese Networks and Label Tuning

Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classification

On Continual Model Refinement in Out-of-Distribution Data Streams

Overcoming Catastrophic Forgetting beyond Continual Learning: Balanced Training for Neural Machine Translation

PPT: Pre-trained Prompt Tuning for Few-shot Learning

Prompt-Based Rule Discovery and Boosting for Interactive WeaklySupervised Learning

Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction

Prompt-free and Efficient Few-shot Learning with Language Models

Prototypical Verbalizer for Prompt-based Few-shot Tuning

Turning Tables: Generating Examples from Semi-structured Tables for Endowing Language Models with Reasoning Skills

UniPELT: A Unified Framework for Parameter-Efficient Language Model Tuning

表示学习

A Contrastive Framework for Learning Sentence Representations from Pairwise and Triple-wise Perspective in Angular Space

Auto-Debias: Debiasing Masked Language Models with Automated Biased Prompts

Compact Token Representations with Contextual Quantization for Efficient Document Re-ranking

Contextual Representation Learning beyond Masked Language Modeling

Contrastive Visual Semantic Pretraining Magnifies the Semantics of Natural Language Representations

Cross-Lingual Contrastive Learning for Fine-Grained Entity Typing for LowResource Languages

Cross-Modal Discrete Representation Learning

Debiased Contrastive Learning of Unsupervised Sentence Representations

Enhancing Chinese Pre-trained Language Model via Heterogeneous Linguistics Graph

GL-CLeF: A Global--Local Contrastive Learning Framework for Crosslingual Spoken Language Understanding

Improving Event Representation via Simultaneous Weakly Supervised Contrastive Learning and Clustering

Just Rank: Rethinking Evaluation with Word and Sentence Similarities

Language-agnostic BERT Sentence Embedding

Learning Disentangled Representations of Negation and Uncertainty

Learning Disentangled Textual Representations via Statistical Measures of Similarity

Multilingual Molecular Representation Learning via Contrastive Pre-training

Nibbling at the Hard Core of Word Sense Disambiguation

Noisy Channel Language Model Prompting for Few-Shot Text Classification

Rare and Zero-shot Word Sense Disambiguation using Z-Reweighting

Sentence-level Privacy for Document Embeddings

Softmax Bottleneck Makes Language Models Unable to Represent Multimode Word Distributions

SPoT: Better Frozen Model Adaptation through Soft Prompt Transfer

Tackling Fake News Detection by Continually Improving Social Context Representations using Graph Neural Networks

The Grammar-Learning Trajectories of Neural Language Models

Using Context-to-Vector with Graph Retrofitting to Improve Word Embeddings

Machine Learning for NLP【NLP中的机器学习】

A Rationale-Centric Framework for Human-in-the-loop Machine Learning

Bias Mitigation in Machine Translation Quality Estimation

Disentangled Sequence to Sequence Learning for Compositional Generalization

DoCoGen: Domain Counterfactual Generation for Low Resource Domain Adaptation

Domain Adaptation in Multilingual and Multi-Domain Monolingual Settings for Complex Word Identification

Domain Knowledge Transferring for Pre-trained Language Model via Calibrated Activation Boundary Distillation

Learning Functional Distributional Semantics with Visual Data

Leveraging Relaxed Equilibrium by Lazy Transition for Sequence Modeling

Local Languages, Third Spaces, and other High-Resource Scenarios

Meta-learning via Language Model In-context Tuning

MPII: Multi-Level Mutual Promotion for Inference and Interpretation

On the Calibration of Pre-trained Language Models using Mixup Guided by Area Under the Margin and Saliency

Overcoming a Theoretical Limitation of Self-Attention

Rethinking Negative Sampling for Handling Missing Entity Annotations

Rethinking Self-Supervision Objectives for Generalizable Coherence Modeling

Robust Lottery Tickets for Pre-trained Language Models

Sharpness-Aware Minimization Improves Language Model Generalization

Skill Induction and Planning with Latent Language

The Trade-offs of Domain Adaptation for Neural Language Models

Distributionally Robust Finetuning BERT for Covariate Drift in Spoken Language Understanding

Learning to Imagine: Integrating Counterfactual Thinking in Neural Discrete Reasoning

Machine Translation and Multilinguality【机器翻译与多语】

翻译

Alignment-Augmented Consistent Translation for Multilingual Open Information Extraction

Alternative Input Signals Ease Transfer in Multilingual Machine Translation

BiTIIMT: A Bilingual Text-infilling Method for Interactive Machine Translation

Bridging the Data Gap between Training and Inference for Unsupervised Neural Machine Translation

Can Transformer be Too Compositional? Analysing Idiom Processing in Neural Machine Translation

CipherDAug: Ciphertext based Data Augmentation for Neural Machine Translation

Conditional Bilingual Mutual Information Based Adaptive Training for Neural Machine Translation

Confidence Based Bidirectional Global Context Aware Training Framework for Neural Machine Translation

DEEP: DEnoising Entity Pre-training for Neural Machine Translation

DiBiMT: A Novel Benchmark for Measuring Word Sense Disambiguation Biases in Machine Translation

Divide and Rule: Effective Pre-Training for Context-Aware Multi-Encoder Translation Models

EAG: Extract and Generate Multi-way Aligned Corpus for Complete Multilingual Neural Machine Translation

Efficient Cluster-Based k-Nearest-Neighbor Machine Translation

Flow-Adapter Architecture for Unsupervised Machine Translation

From Simultaneous to Streaming Machine Translation by Leveraging Streaming History

Improving Word Translation via Two-Stage Contrastive Learning

Integrating Vectorized Lexical Constraints for Neural Machine Translation

Investigating Failures of Automatic Translation in the Case of Unambiguous Gender

Learning Adaptive Segmentation Policy for End-to-End Simultaneous Translation

Learning Confidence for Transformer-based Neural Machine Translation

Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation

Learning When to Translate for Streaming Speech

Measuring and Mitigating Name Biases in Neural Machine Translation

Modeling Dual Read/Write Paths for Simultaneous Machine Translation

MSP: Multi-Stage Prompting for Making Pre-trained Language Models Better Translators

Multilingual Document-Level Translation Enables Zero-Shot Transfer From Sentences to Documents

Multilingual Mix: Example Interpolation Improves Multilingual Neural Machine Translation

Neural Machine Translation with Phrase-Level Universal Visual Representations

On Vision Features in Multimodal Machine Translation

Overcoming Catastrophic Forgetting beyond Continual Learning: Balanced Training for Neural Machine Translation

Prediction Difference Regularization against Perturbation for Neural Machine Translation

Redistributing Low-Frequency Words: Making the Most of Monolingual Data in Non-Autoregressive Translation

Reducing Position Bias in Simultaneous Machine Translation with Length Aware Framework

Scheduled Multi-task Learning for Neural Chat Translation

The Paradox of the Compositionality of Natural Language: A Neural Machine Translation Case Study

Towards Making the Most of Cross-Lingual Transfer for Zero-Shot Neural Machine Translation

Understanding and Improving Sequence-to-Sequence Pretraining for Neural Machine Translation

Unified Speech-Text Pre-training for Speech Translation and Recognition

UniTE: Unified Translation Evaluation

Universal Conditional Masked Language Pre-training for Neural Machine Translation

多语

AmericasNLI: Evaluating Zero-shot Natural Language Understanding of Pretrained Multilingual Models in Truly Low-resource Languages

Cross-Lingual Ability of Multilingual Masked Language Models: A Study of Language Structure

Domain Adaptation in Multilingual and Multi-Domain Monolingual Settings for Complex Word Identification

Expanding Pretrained Models to Thousands More Languages via Lexiconbased Adaptation

Match the Script, Adapt if Multilingual: Analyzing the Effect of Multilingual Pretraining on Cross-lingual Transferability

mLUKE: The Power of Entity Representations in Multilingual Pretrained Language Models

Multi Task Learning For Zero Shot Performance Prediction of Multilingual Models

Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction

Multilingual Knowledge Graph Completion with Self-Supervised Adaptive Graph Alignment

Multilingual Molecular Representation Learning via Contrastive Pre-training

Multilingual unsupervised sequence segmentation transfers to extremely low-resource languages

One Country, 700+ Languages: NLP Challenges for Underrepresented Languages and Dialects in Indonesia

Prix-LM: Pretraining for Multilingual Knowledge Base Construction

Probing Structured Pruning on Multilingual Pre-trained Models: Settings, Algorithms, and Efficiency

Question Answering【问答与理解】

阅读理解

AdaLoGN: Adaptive Logic Graph Network for Reasoning-Based Machine Reading Comprehension

Deep Inductive Logic Reasoning for Multi-Hop Reading Comprehension

Improving Machine Reading Comprehension with Contextualized Commonsense Knowledge

Learning Disentangled Semantic Representations for Zero-Shot CrossLingual Transfer in Multilingual Machine Reading Comprehension

Lite Unified Modeling for Discriminative Reading Comprehension

Modeling Temporal-Modal Entity Graph for Procedural Multimodal Machine Comprehension

What Makes Reading Comprehension Questions Difficult?

MultiHiertt: Numerical Reasoning over Multi Hierarchical Tabular and Textual Data

问答

Answer-level Calibration for Free-form Multiple Choice Question Answering

Answering Open-Domain Multi-Answer Questions via a Recall-then-Verify Framework

CQG: A Simple and Effective Controlled Generation Framework for Multihop Question Generation

Ditch the Gold Standard: Re-evaluating Conversational Question Answering

Generated Knowledge Prompting for Commonsense Reasoning

How Do We Answer Complex Questions: Discourse Structure of Long-form Answers

Hypergraph Transformer: Weakly-Supervised Multi-hop Reasoning for Knowledge-based Visual Question Answering

Hyperlink-induced Pre-training for Passage Retrieval in Open-domain Question Answering

Improving Time Sensitivity for Question Answering over Temporal Knowledge Graphs

It is AI’s Turn to Ask Humans a Question: Question-Answer Pair Generation for Children's Story Books

KaFSP: Knowledge-Aware Fuzzy Semantic Parsing for Conversational Question Answering over a Large-Scale Knowledge Base

KG-FiD: Infusing Knowledge Graph in Fusion-in-Decoder for Open-Domain Question Answering

MMCoQA: Conversational Question Answering over Text, Tables, and Images

Modeling Multi-hop Question Answering as Single Sequence Prediction

On the Robustness of Question Rewriting Systems to Questions of Varying Hardness

Open Domain Question Answering with A Unified Knowledge Interface

Program Transfer for Answering Complex Questions over Knowledge Bases

Retrieval-guided Counterfactual Generation for QA

RNG-KBQA: Generation Augmented Iterative Ranking for Knowledge Base Question Answering

Sequence-to-Sequence Knowledge Graph Completion and Question Answering

Simulating Bandit Learning from User Feedback for Extractive Question Answering

Subgraph Retrieval Enhanced Model for Multi-hop Knowledge Base Question Answering

Synthetic Question Value Estimation for Domain Adaptation of Question Answering

Your Answer is Incorrect... Would you like to know why? Introducing a Bilingual Short Answer Feedback Dataset

Resources and Evaluation【数据集与评估方法】

数据集

A Statutory Article Retrieval Dataset in French

CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark

Chart-to-Text: A Large-Scale Benchmark for Chart Summarization

CICERO: A Dataset for Contextualized Commonsense Inference in Dialogues

CLUES: A Benchmark for Learning Classifiers using Natural Language Explanations

ConditionalQA: A Complex Reading Comprehension Dataset with Conditional Answers

Cree Corpus: A Collection of nêhiyawêwin Resources

Detecting Unassimilated Borrowings in Spanish: An Annotated Corpus and Approaches to Modeling

DialFact: A Benchmark for Fact-Checking in Dialogue

DiBiMT: A Novel Benchmark for Measuring Word Sense Disambiguation Biases in Machine Translation

Down and Across: Introducing Crossword-Solving as a New NLP Benchmark

e-CARE: a New Dataset for Exploring Explainable Causal Reasoning

EntSUM: A Data Set for Entity-Centric Extractive Summarization

ePiC: Employing Proverbs in Context as a Benchmark for Abstract Language Understanding

FairLex: A Multilingual Benchmark for Evaluating Fairness in Legal Text Processing

Fantastic Questions and Where to Find Them: FairytaleQA -- An Authentic Dataset for Narrative Comprehension

Few-Shot Tabular Data Enrichment Using Fine-Tuned Transformer Architectures

French CrowS-Pairs: Extending a challenge dataset for measuring social bias in masked language models to a language other than English

From text to talk: Harnessing conversational corpora for humane and diversity-aware language technology

HiTab: A Hierarchical Table Dataset for Question Answering and Natural Language Generation

IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument Mining Tasks

Image Retrieval from Contextual Descriptions

KQA Pro: A Dataset with Explicit Compositional Programs for Complex Question Answering over Knowledge Base

LexGLUE: A Benchmark Dataset for Legal Language Understanding in English

M3ED: Multi-modal Multi-scene Multi-label Emotional Dialogue Database

MSCTD: A Multimodal Sentiment Chat Translation Dataset

NumGLUE: A Suite of Fundamental yet Challenging Mathematical Reasoning Tasks

QuoteR: A Benchmark of Quote Recommendation for Writing

Reports of personal experiences and stories in argumentation: datasets and analysis

RNSum: A Large-Scale Dataset for Automatic Release Note Generation via Commit Logs Summarization

SciNLI: A Corpus for Natural Language Inference on Scientific Text

SummScreen: A Dataset for Abstractive Screenplay Summarization

SUPERB-SG: Enhanced Speech processing Universal PERformance Benchmark for Semantic and Generative Capabilities

Textomics: A Dataset for Genomics Data Summary Generation

The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems

ToxiGen: A Large-Scale Machine-Generated Dataset for Adversarial and Implicit Hate Speech Detection

VALSE: A Task-Independent Benchmark for Vision and Language Models Centered on Linguistic Phenomena

WatClaimCheck: A new Dataset for Claim Entailment and Inference

Your Answer is Incorrect... Would you like to know why? Introducing a Bilingual Short Answer Feedback Dataset

评估

Active Evaluation: Efficient NLG Evaluation with Few Pairwise Comparisons

AmericasNLI: Evaluating Zero-shot Natural Language Understanding of Pretrained Multilingual Models in Truly Low-resource Languages

BenchIE: A Framework for Multi-Faceted Fact-Based Open Information Extraction Evaluation

Bias Mitigation in Machine Translation Quality Estimation

CARETS: A Consistency And Robustness Evaluative Test Suite for VQA

ChatMatch: Evaluating Chatbots by Autonomous Chat Tournaments

CTRLEval: An Unsupervised Reference-Free Metric for Evaluating Controlled Text Generation

DEAM: Dialogue Coherence Evaluation using AMR-based Semantic Manipulations

Evaluating Factuality in Text Simplification

FIBER: Fill-in-the-Blanks as a Challenging Video Understanding Evaluation Framework

FrugalScore: Learning Cheaper, Lighter and Faster Evaluation Metrics for Automatic Text Generation

Generative Pretraining for Paraphrase Evaluation

Human Evaluation and Correlation with Automatic Metrics in Consultation Note Generation

Is GPT-3 Text Indistinguishable from Human Text? Scarecrow: A Framework for Scrutinizing Machine Text

Just Rank: Rethinking Evaluation with Word and Sentence Similarities

Logic Traps in Evaluating Attribution Scores

Quantified Reproducibility Assessment of NLP Results

ReCLIP: A Strong Zero-Shot Baseline for Referring Expression Comprehension

RoMe: A Robust Metric for Evaluating Natural Language Generation

SRL4E – Semantic Role Labeling for Emotions: A Unified Evaluation Framework

TruthfulQA: Measuring How Models Mimic Human Falsehoods

Under the Morphosyntactic Lens: A Multifaceted Evaluation of Gender Bias in Speech Translation

UniTE: Unified Translation Evaluation

Sentence-level Semantics, Textual Classification, and Other Areas【句子级语义和文本关系推理】

Incorporating Hierarchy into Text Encoder: a Contrastive Learning Approach for Hierarchical Text Classification

Adversarial Soft Prompt Tuning for Cross-Domain Sentiment Analysis

Bag-of-Words vs. Graph vs. Sequence in Text Classification: Questioning the Necessity of Text-Graphs and the Surprising Strength of a Wide MLP

Cluster & Tune: Boost Cold Start Performance in Text Classification

Discrete Opinion Tree Induction for Aspect-based Sentiment Analysis

Early Stopping Based on Unlabeled Samples in Text Classification

Effective Token Graph Modeling using a Novel Labeling Strategy for Structured Sentiment Analysis

Enhanced Multi-Channel Graph Convolutional Network for Aspect Sentiment Triplet Extraction

Entailment Graph Learning with Textual Entailment and Soft Transitivity

Evaluating Extreme Hierarchical Multi-label Classification

FaiRR: Faithful and Robust Deductive Reasoning over Natural Language

Improving Meta-learning for Low-resource Text Classification and Generation via Memory Imitation

Incorporating Hierarchy into Text Encoder: a Contrastive Learning Approach for Hierarchical Text Classification

KenMeSH: Knowledge-enhanced End-to-end Biomedical Text Labelling

Label Semantic Aware Pre-training for Few-shot Text Classification

Learn to Adapt for Generalized Zero-Shot Text Classification

Leveraging Task Transferability to Meta-learning for Clinical Section Classification with Limited Data

Measuring Fairness of Text Classifiers via Prediction Sensitivity

On the Robustness of Offensive Language Classifiers

Toward Interpretable Semantic Textual Similarity via Optimal Transportbased Contrastive Sentence Learning

Towards Comprehensive Patent Approval Predictions:Beyond Traditional Document Classification

Semantics and Syntax Parsing【语义与句法解析】

语义解析

LAGr: Label Aligned Graphs for Better Systematic Generalization in Semantic Parsing

Fully-Semantic Parsing and Generation: the BabelNet Meaning Representation

Graph Pre-training for AMR Parsing and Generation

LAGr: Label Aligned Graphs for Better Systematic Generalization in Semantic Parsing

Learned Incremental Representations for Parsing

Learning to Generate Programs for Table Fact Verification via StructureAware Semantic Parsing

Modeling Syntactic-Semantic Dependency Correlations in Semantic Role Labeling Using Mixture Models

On The Ingredients of an Effective Zero-shot Semantic Parser

Semantic Composition with PSHRG for Derivation Tree Reconstruction from Graph-Based Meaning Representations

Towards Robustness of Text-to-SQL Models Against Natural and Realistic Adversarial Table Perturbation

Word2Box: Capturing Set-Theoretic Semantics of Words using Box Embedding

句法分析

Investigating Non-local Features for Neural Constituency Parsing

Bottom-Up Constituency Parsing and Nested Named Entity Recognition with Pointer Networks

Compositional Generalization in Dependency Parsing

Dependency Parsing as MRC-based Span-Span Prediction

Headed-Span-Based Projective Dependency Parsing

Investigating Non-local Features for Neural Constituency Parsing

Meta-Learning for Fast Cross-Lingual Adaptation in Dependency Parsing

Phrase-aware Unsupervised Constituency Parsing

Probing for Labeled Dependency Trees

Semi-supervised Domain Adaptation for Dependency Parsing with Dynamic Matching Network

Substructure Distribution Projection for Zero-Shot Cross-Lingual Dependency Parsing

TwittIrish: A Universal Dependencies Treebank of Tweets in Modern Irish

Unsupervised Dependency Graph Network

命名实体识别

CONTaiNER: Few-Shot Named Entity Recognition via Contrastive Learning

De-Bias for Generative Extraction in Unified NER Task

Distantly Supervised Named Entity Recognition via Confidence-Based Multi-Class Positive and Unlabeled Learning

Few-Shot Class-Incremental Learning for Named Entity Recognition

Few-shot Named Entity Recognition with Self-describing Networks

Good Examples Make A Faster Learner: Simple Demonstration-based Learning for Low-resource NER

MELM: Data Augmentation with Masked Entity Language Modeling for LowResource NER

MINER: Improving Out-of-Vocabulary Named Entity Recognition from an Information Theoretic Perspective

Nested Named Entity Recognition as Latent Lexicalized Constituency Parsing

Nested Named Entity Recognition with Span-level Graphs

Parallel Instance Query Network for Named Entity Recognition

指代消解

Adapting Coreference Resolution Models through Active Learning

Constrained Multi-Task Learning for Bridging Resolution

实体识别，对齐与消歧

ExtEnD: Extractive Entity Disambiguation

FiNER: Financial Numeric Entity Recognition for XBRL Tagging

Learning from Sibling Mentions with Scalable Graph Inference in FineGrained Entity Typing

An Effective and Efficient Entity Alignment Decoding Algorithm via Third-Order Tensor Isomorphism

Divide and Denoise: Learning from Noisy Labels in Fine-Grained Entity Typing with Cluster-Wise Loss Correction

其它

A Neural Network Architecture for Program Understanding Inspired by Human Behaviors

Bridging the Generalization Gap in Text-to-SQL Parsing with Schema Expansion

Fair and Argumentative Language Modeling for Computational Argumentation

LexSubCon: Integrating Knowledge from Lexical Resources into Contextual Embeddings for Lexical Substitution

Make the Best of Cross-lingual Transfer: Evidence from POS Tagging with over 100 Languages

Variational Graph Autoencoding as Cheap Supervision for AMR Coreference Resolution

Speech and Multimodality【语音与多模态】

多模态

Analyzing Generalization of Vision and Language Navigation to Unseen Outdoor Areas

CARETS: A Consistency And Robustness Evaluative Test Suite for VQA

CLIP Models are Few-Shot Learners: Empirical Studies on VQA and Visual Entailment

Contrastive Visual Semantic Pretraining Magnifies the Semantics of Natural Language Representations

End-to-End Modeling via Information Tree for One-Shot Natural Language Spatial Video Grounding

Guided Attention Multimodal Multitask Financial Forecasting with InterCompany Relationships and Global and Local News

Image Retrieval from Contextual Descriptions

Letters From the Past: Modeling Historical Sound Change Through Diachronic Character Embeddings

Leveraging Visual Knowledge in Language Tasks: An Empirical Study on Intermediate Pre-training for Cross-Modal Knowledge Transfer

Modeling Temporal-Modal Entity Graph for Procedural Multimodal Machine Comprehension

Multi-Modal Sarcasm Detection via Cross-Modal Graph Convolutional Network

Multimodal Dialogue Response Generation

Multimodal fusion via cortical network inspired losses

Multimodal Sarcasm Target Identification in Tweets

On Vision Features in Multimodal Machine Translation

OpenHands: Making Sign Language Recognition Accessible with Posebased Pretrained Models across Languages

Phone-ing it in: Towards Flexible Multi-Modal Language Model Training by Phonetic Representations of Data

Premise-based Multimodal Reasoning: Conditional Inference on Joint Textual and Visual Clues

RoCBert: Robust Chinese Bert with Multimodal Contrastive Pretraining

There’s a Time and Place for Reasoning Beyond the Image

Things not Written in Text: Exploring Spatial Commonsense from Visual Signals

Understanding Multimodal Procedural Knowledge by Sequencing Multimodal Instructional Manuals

UniTranSeR: A Unified Transformer Semantic Representation Framework for Multimodal Task-Oriented Dialog System

Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Visual-Language Navigation Pretraining via Prompt-based Environmental Self-exploration

WikiDiverse: A Multimodal Entity Linking Dataset with Diversified Contextual Topics and Entity Types

语音

Cross-Utterance Conditioned VAE for Non-Autoregressive Text-to-Speech

Decoding Part-of-Speech from Human EEG Signals

Direct Speech-to-Speech Translation With Discrete Units

Language-Agnostic Meta-Learning for Low-Resource Text-to-Speech with Articulatory Features

Leveraging Unimodal Self-Supervised Learning for Multimodal Audio-Visual Speech Recognition

Requirements and Motivations of Low-Resource Speech Synthesis for Language Revitalization

Revisiting Over-Smoothness in Text to Speech

Self-supervised Semantic-driven Phoneme Discovery for Zero-resource Speech Recognition

SpeechT5: Unified-Modal Encoder-Decoder Pre-Training for Spoken Language Processing

STEMM: Self-learning with Speech-text Manifold Mixup for Speech Translation

Text-Free Prosody-Aware Generative Spoken Language Modeling

Do self-supervised speech models develop human-like perception biases?

Summation【摘要】

A Multi-Document Coverage Reward for RELAXed Multi-Document Summarization

A Variational Hierarchical Model for Neural Cross-Lingual Summarization

ASPECTNEWS: Aspect-Oriented Summarization of News Documents

Attention Temperature Matters in Abstractive Summarization Distillation

BRIO: Bringing Order to Abstractive Summarization

Chart-to-Text: A Large-Scale Benchmark for Chart Summarization

Differentiable Multi-Agent Actor-Critic for Multi-Step Radiology Report Summarization

Discriminative Marginalized Probabilistic Neural Method for Multi-Document Summarization of Medical Literature

DYLE: Dynamic Latent Extraction for Abstractive Long-Input Summarization

Educational Question Generation of Children Storybooks via Question Type Distribution Learning and Event-centric Summarization

EntSUM: A Data Set for Entity-Centric Extractive Summarization

Graph Enhanced Contrastive Learning for Radiology Findings Summarization

Hallucinated but Factual! Inspecting the Factuality of Hallucinations in Abstractive Summarization

HIBRIDS: Attention with Hierarchical Biases for Structure-aware Long Document Summarization

Learning Non-Autoregressive Models from Search for Unsupervised Sentence Summarization

Learning the Beauty in Songs: Neural Singing Voice Beautifier

Length Control in Abstractive Summarization by Pretraining Information Selection

MemSum: Extractive Summarization of Long Documents Using Multi-Step Episodic Markov Decision Processes

Neural Label Search for Zero-Shot Multi-Lingual Extractive Summarization

Other Roles Matter! Enhancing Role-Oriented Dialogue Summarization via Role Interactions

Predicting Intervention Approval in Clinical Trials through Multi-Document Summarization

PRIMERA: Pyramid-based Masked Sentence Pre-training for Multidocument Summarization

Summ^N: A Multi-Stage Summarization Framework for Long Input Dialogues and Documents

SummaReranker: A Multi-Task Mixture-of-Experts Re-ranking Framework for Abstractive Summarization

The patient is more dead than alive: exploring the current state of the multidocument summarisation of the biomedical literature

Towards Abstractive Grounded Summarization of Podcast Transcripts

Unsupervised Extractive Opinion Summarization Using Sparse Coding

Updated Headline Generation: Creating Updated Summaries for Evolving News Stories

Knowledge Graph【知识图谱】

CAKE: A Scalable Commonsense-Aware Framework For Multi-View Knowledge Graph Completion

Efficient Hyper-parameter Search for Knowledge Graph Embedding

KaFSP: Knowledge-Aware Fuzzy Semantic Parsing for Conversational Question Answering over a Large-Scale Knowledge Base

Multilingual Knowledge Graph Completion with Self-Supervised Adaptive Graph Alignment

Prix-LM: Pretraining for Multilingual Knowledge Base Construction

RotateQVS: Representing Temporal Information as Rotations in Quaternion Vector Space for Temporal Knowledge Graph Completion

Sequence-to-Sequence Knowledge Graph Completion and Question Answering

SimKGC: Simple Contrastive Knowledge Graph Completion with Pretrained Language Models

Understanding Gender Bias in Knowledge Base Embeddings

Special Track【特殊任务】

Code Relevant

Accelerating Code Search with Deep Hashing and Code Classification

Impact of Evaluation Methodologies on Code Summarization

Modeling Hierarchical Syntax Structure with Triplet Position for Source Code Summarization

Towards Learning (Dis)-Similarity of Source Code from Program Contrasts

UniXcoder: Unified Cross-Modal Pre-training for Code Representation

ReACC: A Retrieval-Augmented Code Completion Framework

Impact of Evaluation Methodologies on Code Summarization

Math Problem

Learning to Reason Deductively: Math Word Problem Solving as Complex Relation Extraction

Continual Pre-training of Language Models for Math Problem Understanding with Syntax-Aware Memory Network

NumGLUE: A Suite of Fundamental yet Challenging Mathematical Reasoning Tasks

Word / Sentence Segmentation

Weakly Supervised Word Segmentation for Computational Language Documentation

Word Segmentation as Unsupervised Constituency Parsing

That Slepen Al the Nyght with Open Ye! Cross-era Sequence Segmentation with Switch-memory

TopWORDS-Seg: Simultaneous Text Segmentation and Word Discovery for Open-Domain Chinese Texts via Bayesian Inference

Others

Automated Crossword Solving

CaMEL: Case Marker Extraction without Labels

Characterizing Idioms: Conventionality and Contingency

Challenges and Strategies in Cross-Cultural NLP

Clickbait Spoiling via Question Answering and Passage Retrieval

Computational Historical Linguistics and Language Diversity in South Asia

Doctor Recommendation in Online Health Forums via Expertise Learning

Ensembling and Knowledge Distilling of Large Sequence Taggers for Grammatical Error Correction

Entity-based Neural Local Coherence Modeling

Ethics Sheets for AI Tasks

HOLM: Hallucinating Objects with Language Models for Referring Expression Recognition in Partially-Observed Scenes

Identifying Chinese Opinion Expressions with Extremely-Noisy Crowdsourcing Annotations

Identifying Moments of Change from Longitudinal User Text

Identifying the Human Values behind Arguments

Improving the Generalizability of Depression Detection by Leveraging Clinical Questionnaires

Incorporating Stock Market Signals for Twitter Stance Detection

Inferring Rewards from Language in Context

Large Scale Substitution-based Word Sense Induction

Learning From Failure: Data Capture in an Australian Aboriginal Community

Leveraging Similar Users for Personalized Language Modeling with Limited Data

Leveraging Wikipedia article evolution for promotional tone detection

Misinfo Reaction Frames: Reasoning about Readers' Reactions to News Headlines

Multilingual Detection of Personal Employment Status on Twitter

Not always about you: Prioritizing community needs when developing endangered language technology

Perceiving the World: Question-guided Reinforcement Learning for Text-based Games

Reinforcement Guided Multi-Task Learning Framework for Low-Resource Stereotype Detection

Searching for fingerspelled content in American Sign Language

Slangvolution: A Causal Analysis of Semantic Change and Frequency Dynamics in Slang

Toward Annotator Group Bias in Crowdsourcing

Towards Afrocentric NLP for African Languages: Where We Are and Where We Can Go

Uncertainty Estimation of Transformer Predictions for Misclassification Detection

VALUE: Understanding Dialect Disparity in NLU

You might think about slightly revising the title: Identifying Hedges in Peertutoring Interactions

A Functionalist Account of Vowel System Typology

原文链接：ACL 2022 主会长文论文分类整理

你可能感兴趣的:(人工智能NLP等前沿资讯,nlp,自然语言处理)

大模型火爆 2025：LLaMA、Qwen、DeepSeek 核心原理+就业秘籍，快速入门 AI 工程师 weixin_40941102 llama 人工智能
1.大模型核心原理：从零开始理解AI模型这些是大型语言模型（LLMs）的核心技术，适合初学者逐步深入学习。以下是详细拆解，让小白也能掌握：LLaMA系列模型核心原理详解：什么是LLaMA？：LLaMA是一个基于人工智能的语言模型，像一个超级聪明的聊天机器人，能理解和生成人类语言。它由Meta公司开发，类似ChatGPT，但更开源、灵活。核心原理：Transformer架构：想象一个工厂流水线，LL
【AI热点】MCP协议深度洞察报告碣石潇湘无限路人工智能 php 开发语言
摘要人工智能技术飞速发展，大型语言模型（LLM）如何高效、安全地利用外部数据和工具成为关键问题。模型上下文协议（ModelContextProtocol，简称MCP）是一种由Anthropic于2024年底提出的开放标准协议。它通过统一的客户端-服务器架构，为AI应用与文件系统、数据库、第三方API等外部资源之间提供标准化、安全的双向通信接口。本文将深入解析MCP协议的基本概念和背景、架构设计（通
正则表达式全解析 + Java常用示例我真的不想做程序员算法 java java 后端开发语言算法正则表达式
目录一、正则表达式基础（一）元字符（二）字符集（三）量词二、正则表达式常用示例（一）验证邮箱格式（二）验证电话号码格式（三）提取网页中的链接（四）验证日期格式（五）验证URL格式三、正则表达式在Java中的应用（一）匹配操作（二）替换操作（三）分割操作四、总结一、正则表达式基础正则表达式是一种用于匹配字符串的强大工具。它使用特定的语法来定义匹配模式，可以在文本处理、表单验证、数据提取等场景中发挥重
2025年Python生态全景：从AI霸主到量子计算，揭秘其不可替代的技术魅力南玖yy python 人工智能量子计算
在2025年的技术浪潮中，Python凭借其极简的语法、庞大的生态系统以及跨领域融合能力，依然稳坐编程语言界的“头把交椅”。尽管Java等语言在AI领域发起挑战，但Python通过持续的技术革新和生态扩展，展现出不可撼动的生命力。本文将从技术趋势、行业应用与未来挑战三个维度，解析Python的“常青”密码。一、AI领域的持续主导：生态优势与工具革新Python在AI领域的统治地位仍未动摇。尽管有观
自立自强的江铃集团新能源，用科技创新实力圈粉微视资讯汽车
汽车行业正在经历从价格竞争和配置堆砌，向技术回归的深刻转型。消费者对“冰箱、彩电、大沙发”式的噱头已经逐渐失去兴趣，取而代之的是对核心技术和安全性能的理性关注。在这样的背景下，江铃集团新能源凭借深厚的技术积累和创新能力迅速赢得市场认可。作为拥有56年造车经验的企业，江铃集团新能源在整车研发、智能制造、智能网联、三电技术和车身轻量化等领域全面突破，不仅成功定位于纯电市场，还通过前瞻性的创新战略实现了
使用 Python 编写网络爬虫：从入门到实战 Manaaaaaaa python 爬虫开发语言
网络爬虫是一种自动化获取网页信息的程序，通常用于数据采集、信息监控等领域。Python是一种广泛应用于网络爬虫开发的编程语言，具有丰富的库和框架来简化爬虫的编写和执行过程。本文将介绍如何使用Python编写网络爬虫，包括基本原理、常用库和实战案例。一、原理介绍网络爬虫是一种自动化程序，通过模拟浏览器的行为向网络服务器发送HTTP请求，获取网页内容并进一步提取所需信息的过程。网络爬虫主要用于数据采集
列表推导式_Python教程曹操贪慕小乔 python基础 python numpy 算法
内容摘要Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、文章正文Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、集合推导式和字典推导式。我们先着重来介绍最常使用的列
【数字IC验证】博客内容全览 MoorePlus 数字IC验证百宝箱经验分享面试数字IC 芯片验证 SV
【导读】：数字IC验证百宝箱涵盖博主在实际工作中常用的技能与工具，包括但不限于SV、UVM、Formal、脚本(perl/python/shell)及EDA工具快速上手使用等。无论你是刚踏入职场的验证小白，还是希望回顾基础寻找跳槽机会的从业者，本专栏都能为你提供实用的技术支持，在达成目标的路上，助你一臂之力。“凡是能用钱买来的时间就是便宜的；凡是能用时间换来的注意力持续就是有价值的。”（附上超链接
DeepSeek：技术创作者的内容革命，从代码到爆文的AI全栈攻略不想加班的码小牛人工智能 ai chatgpt
一、为什么技术创作者需要关注DeepSeek？作为CSDN的资深用户，你是否经历过这些痛点？选题焦虑：技术热点日新月异，如何抓住「大模型优化」或「量子计算落地」等前沿方向？写作卡顿：明明代码跑通了，却在技术原理描述环节反复修改效率瓶颈：既要写技术文档又要运营专栏，时间永远不够用DeepSeek的多模态理解能力（支持代码+自然语言混合输入）和领域自适应特性（自动识别技术文档/教程/测评等文体），让它
SDN技术解码：架构革新与数字化转型实践指南 ——从控制平面到AI融合的网络进化论不想加班的码小牛架构平面人工智能网络协议
一、引言：SDN如何重塑网络价值体系？在数字化浪潮下，传统网络架构的僵化性已成为制约业务创新的瓶颈。SDN（软件定义网络）通过解耦控制与转发平面，将网络从“黑盒设备”转变为“可编程服务”，为云计算、物联网等领域提供动态、智能的网络底座。例如，某金融企业通过SDN实现跨地域数据中心流量智能调度，业务故障恢复时间缩短至分钟级。二、SDN核心架构与技术原理1.三层架构：控制-转发-应用的协同生态•控制层
NPU的应用场景：从云端到边缘绿算技术 NPU架构介绍缓存人工智能科技深度学习
NPU的应用场景非常广泛，主要包括以下几个方面：1.云计算与数据中心AI推理服务：在云端提供高效的AI推理服务，例如图像识别、语音识别。模型训练加速：在大规模训练任务中，NPU可以作为加速单元，提升训练效率。2.边缘计算智能摄像头：在安防监控中，NPU可以实时处理视频流，实现目标检测和跟踪。智能音箱：在语音助手中，NPU可以加速语音识别和自然语言处理任务。3.自动驾驶实时感知：NPU可以加速自动驾
NPU的工作原理：神经网络计算的流水线绿算技术 NPU架构介绍神经网络人工智能深度学习
NPU的工作原理可以概括为以下几个步骤：1.模型加载·将训练好的神经网络模型加载到NPU的内存中。2.数据输入·输入数据（如图像、语音）通过接口传输到NPU。3.计算执行·NPU根据模型结构，依次执行卷积、池化、全连接等计算任务。·矩阵乘法单元和卷积加速器并行工作，高效完成计算。4.结果输出·计算完成后，输出结果（如分类标签、检测框）返回给主机或其他处理器。5.任务调度·在多任务场景下，NPU的任
DPU的架构：模块化与可扩展性绿算技术 DPU架构介绍架构科技缓存算法
DPU的架构设计注重模块化和可扩展性，以下是其典型架构：1.网络接口模块支持高速网络接口，例如100GbE、200GbE，甚至更高带宽的接口。2.处理核心模块包括多个ARM核心和专用加速核心，用于处理控制平面和数据平面任务。3.硬件加速模块包括网络加速引擎、存储加速引擎、加密引擎等，用于加速特定任务。4.内存与缓存集成高速内存和缓存，用于存储临时数据和指令。5.PCIe接口模块提供与主机CPU的高
DPU的未来：技术趋势与挑战绿算技术 DPU架构介绍科技 gpu算力硬件工程缓存架构
随着数据中心的不断发展，DPU技术也在快速演进。以下是DPU未来的技术趋势与挑战：1.更高性能·支持更高的网络带宽（如400GbE、800GbE）和更低的延迟。2.更广泛的应用·在AI、5G、物联网等领域，DPU的应用将进一步扩展。3.软件生态的完善·开源工具和开发框架的普及，将降低DPU的开发门槛。4.能效优化·在提升性能的同时，进一步降低功耗，满足绿色计算的需求。总结DPU作为一种新兴的数据处
应用场景下的芯片分类绿算技术芯片类型科普探索 html 人工智能科技
从数据中心级别的高性能芯片，到消费类产品级别的日常应用芯片；从工业类产品级别的稳定可靠芯片，到汽车电子级别的高要求芯片；再到军工和国防级别的专用芯片，不同类型的芯片正以其独特的功能和应用场景，满足着多样化的需求。电路类型下的芯片分类·数字电路芯片：处理数字信号，广泛应用于计算机、通信设备等领域。·模拟电路芯片：处理模拟信号，常用于音频、视频处理等场景。·数模混合电路芯片：兼具数字和模拟信号处理功能
2025年国内UWB的企业排行榜人员安全定位物联网
截至2024年，中国UWB（超宽带）领域的企业在技术研发、市场应用和行业影响力方面表现突出。以下是一个基于技术实力、市场份额和行业影响力的国内UWB企业排行榜，供参考：1.品铂科技（Pinpoint）核心优势：专注于UWB高精度定位技术，定位精度可达厘米级。在工业、电厂、司法、监狱管理等领域有丰富的应用经验。应用领域：智慧工业、矿山、物流、司法监狱管理、智慧化工等。提供完整的UWB解决方案，涵盖硬
必看！一文读懂知识蒸馏技术小天才学习机打游戏人工智能知识图谱神经网络 langchain windows
导读最近，DeepSeek的爆火让大家对人工智能领域的技术发展又有了新的关注。而知识蒸馏作为深度学习中一项重要的技术，也在背后默默地发挥着作用，今天就来给大家详细介绍一下知识蒸馏及其相关原理。1.知识蒸馏是什么在深度学习领域，大型模型（如DeepSeek）通常具有强大的性能，但它们的计算量和参数量都非常庞大，这使得它们难以在资源受限的设备（如移动设备或嵌入式设备）上部署。例如，GPT-3在570G
思特奇实践项目入选2024年“数据要素×”大赛优秀项目案例集资讯分享周科技
2024年“数据要素×”大赛是国内首个聚焦数据要素开发应用的全国性大赛,由国家数据局联合有关部门主办,活动围绕《“数据要素×”三年行动计划(2024—2026年)》部署的工业制造、现代农业、文化旅游等12个行业领域对应设置12个赛道,旨在遴选出一批应用成效显著、创新性强、引领效应好的数据要素开发利用解决方案,带动相关技术产业发展。首届“数据要素×”大赛吸引了来自政产研学用等领域的近2万支队伍、10
【Java网络编程】OSI七层网络模型与TCP/IP协议簇 xiaoli8748_软件开发网络通信网络 tcp/ip 网络协议
1.1、OSI七层网络模型OSI七层网络模型中，每层的功能如下：应用层：人与计算机网络交互的窗口。表示层：负责数据格式的封装，如加密、压缩、编解码等。会话层：建立、终止、管理不同端间的会话连接。传输层：提供端到端（两台机器）之间的传输机制，以及提供流量控制、出错效验。网络层：逻辑寻址，IP地址，在下两层的基础上向资源子网提供服务。数据链路层：负责建立和管理节点间的链路，将数据封装成帧，进行可靠传输
如何快速开发一款AI小程序？基于微信云开发的实战指南一键难忘人工智能小程序微信
如何快速开发一款AI小程序？基于微信云开发的实战指南引言微信小程序凭借其轻便、易推广等特点，已成为应用开发的重要方式之一。而AI技术的快速发展让智能化应用成为可能。通过微信云开发（CloudBase）与小程序结合，开发者可以实现从前端到后端的一站式AI应用开发。本文将深入讲解如何利用微信云开发快速搭建一款AI小程序，展示从模型训练到云端部署的完整流程。准备工作在开始开发之前，确保完成以下准备工作：
AI大模型学习路线及相关资源推荐 python游乐园学习资源学习 Python AI AI编程人工智能
哈喽，大家好！本文为大家带来AI大模型学习路线及相关资源推荐，这对于学习掌握AI大模型很有帮助呦，希望大家多多点赞收藏～感谢～～1AI大模型的基础信息1.1什么是AI大模型AI大模型，即人工智能大型模型，是一种基于深度学习技术，具有海量参数、强大算力支持、能够处理和生成复杂数据的人工智能模型。1.2AI大模型的主要特点规模庞大：AI大模型通常包含海量的参数。例如，谷歌的BERT模型在最初发布时就有
Java 表达式代码先锋者 java 开发语言
一、引言在Java编程中，表达式（Expression）是程序的基本组成部分之一。表达式由操作数和运算符组成，它可以计算出一个值。理解和熟练运用Java表达式对于编写高效、准确的Java程序至关重要。二、Java表达式概述表达式是由变量、常量、方法调用、运算符等组成的式子，它可以计算出一个结果。例如，1+2就是一个简单的表达式，其计算结果为3。Java中的表达式可以分为不同的类型，包括算术表达式、
用python实现excel 14个常用操作,用Python 操作 Excel,这篇文章别错过了!(超全总结)... weixin_39851914 用python实现excel 14个常用操作
在之前的办公自动化系列文章中，我已经对Python操作Excel的几个常用库openpyxl、xlrd/xlwt、xlwings、xlsxwriter等进行了详细的讲解。为了进一步带大家了解各个库的异同，从而在不同场景下可以灵活使用，本文将横向比较7个可以操作Excel文件的常用模块，在比较各模块常用操作的同时进行巩固学习！首先让我们来整体把握下不同库的特点“xlrd、xlwt、xlutils各自
自动化测试：从入门到精通的全面指南测试工程师成长之路测试工程师成长之路自动化测试
一、引言在当今数字化时代，软件行业蓬勃发展，软件产品的更新换代愈发频繁。为了确保软件的质量和稳定性，测试工作变得至关重要。然而，随着软件规模的不断扩大和功能的日益复杂，传统的手工测试方法逐渐暴露出效率低下、容易出错等问题。自动化测试作为一种高效、可靠的测试手段，应运而生并迅速发展，成为现代软件测试领域不可或缺的一部分。自动化测试是指借助专门的测试工具和编程技术，将原本由人工执行的测试用例转化为机器
蓝易云 - nginx+lua+redis等架构演进蓝易云 nginx lua redis kubernetes 容器云原生驱动开发
Nginx+Lua+Redis架构演进如下：基本架构：最初，使用Nginx作为反向代理和负载均衡器，将客户端请求分发到后端应用服务器。Nginx的高性能和低资源消耗使其成为处理大量请求的理想选择。引入Lua模块：随着业务复杂度增加，引入Nginx的Lua模块，可以在Nginx配置中嵌入Lua脚本，实现自定义的请求处理逻辑。这种方式可以将部分业务逻辑移至Nginx层，减轻后端应用服务器的压力。集成R
3D FFT在波束形成中的详细解释 DuHz 算法信息与通信信号处理
3DFFT在波束形成中的详细解释1.引言在雷达、声呐和无线通信等领域，为了从空间中获取目标或信号的方向信息，通常需要用到波束形成(Beamforming)技术。波束形成可以理解为一种通过数字信号处理手段，将天线阵列（或传感器阵列）接收的多路信号进行加权和，形成对特定方向（或多个方向）的增强或抑制，从而实现对目标/信号的方位估计与检测的技术。1.11D,2D,和3D波束形成1D波束形成通常针对线阵(
如何应对Maven中的依赖导入挑战？程序员总部 java maven 数据库 sql
在软件开发的世界里，Maven作为一个流行的项目管理工具，为开发者提供了便利，特别是在管理依赖方面。不过，在使用Maven的过程中，依赖导包问题常常困扰着很多开发者。这些问题可能会导致项目构建失败、运行时错误，甚至是难以追踪的bug！那么，如何巧妙地解决这些依赖导入问题呢？理解依赖的作用依赖在Maven中的作用非常关键。它们是项目中所需要的库或框架，比如Spring、JUnit等。每个Maven项
HarmonyNext实战：基于ArkTS的高性能图像处理应用开发应用开发
引言在HarmonyNext生态系统中，图像处理是一个重要且具有挑战性的领域。本文将深入探讨如何利用ArkTS语言开发一个高性能的图像处理应用，重点介绍图像卷积、边缘检测等核心算法的实现。我们将从理论基础出发，逐步构建一个完整的图像处理应用，并通过优化技巧提升性能。图像处理基础1.1图像表示在数字图像处理中，图像通常被表示为一个二维矩阵，每个元素代表一个像素的灰度值或颜色值。在HarmonyNex
用Python添加、读取和删除Word文档属性
在Python中处理Word文档时，对文档属性进行操作是一项重要的任务。文档属性主要分为内置属性（如标题、作者等）和自定义属性（用户根据自身需求定义的属性）。合理地管理这些属性，能够提升文档管理效率、优化信息检索功能，并确保文档数据的准确性与安全性。本文将介绍如何使用Python实现对Word文档属性的添加、读取和删除操作，包括内置文档属性和自定义文档属性。用Python添加文档属性到Word文档
AI大模型测试用例生成平台王根生测试开发测试用例质量保障 AI编程 nlp 测试管理软件测试
AI测试用例生成平台项目背景技术栈业务描述项目展示项目重难点项目背景针对传统接口测试用例设计高度依赖人工经验、重复工作量大、覆盖场景有限等行业痛点，基于大语言模型技术实现接口测试用例智能生成系统。技术栈LangChain框架+GLM-4模型+PromptEngineering+Flask+Python+Bootstrap+jQuery业务描述用户在该平台上传Markdown形式的接口文档，点击生成
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu