dxd-log
🏷️ Tags
💻 Profile
profile_image
DXD
AI/ML Enthusiast
Where there is a shell,there is a way.
🔎 Search
📂 All Posts
🤖 AI/ML

ProbSolv | pip no build isolation开关的观察

Dec 19, 2024

以后再提示torch和本机CUDA不匹配的时候可以试试带上它

tool
ProbSolving
过程备忘
🎇Tech/Tool

过程备忘 | Clash-for-windows正确开启Tun模式

Dec 19, 2024

挺麻烦的,不然节点显示Error连不上

过程备忘
ProbSolving
win
🎇Tech/Tool

过程备忘 | Arc 浏览器 UWP 限制解除

Dec 16, 2024

过程备忘
tool
ProbSolving
🤖 AI/ML

LLM | Machine Unlearning

Dec 11, 2024

机器反学习,选择性遗忘

LLM
调研专题
DLBasic
🤖 AI/ML

DLBasic | AI/ML要点复习

Dec 7, 2024

可能会偏数学

DLBasic
🤖 AI/ML

papers | Learning to (Learn at Test Time): RNNs with Expressive Hidden States

Nov 22, 2024

将隐藏状态建模成可训练的模型

papers
LLM
调研专题
DLBasic
🤖 AI/ML

papers | From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning

Oct 11, 2024

提出了一个指令遵循难度指标

papers
SFTDataSelection
LLM
🎇Tech/Tool

Tools | github镜像前缀

Sep 30, 2024

https://ghp.ci/

tool
FUCKUGFW
probSolving
Website
Git
🎇Tech/Tool

过程备忘 | 无root权限安装zsh

Sep 30, 2024

00

过程备忘
tool
🎇Tech/Tool

Tools | 保存dataframe

Sep 22, 2024

读大的excel文件慢,可以存df

tool
过程备忘
🎇Tech/Tool

过程备忘 | win11安装wsl2和docker

Sep 16, 2024

过程备忘
win
🤖 AI/ML

papers | Rethinking Data Selection for Supervised Fine-Tuning

Sep 4, 2024

主要讲SFT数据选择不应太关注于数据质量和多样性(预训练数据才关注)

LLM
papers
🤖 AI/ML

阅读笔记 | 读论文积累经验

Sep 4, 2024

有些东西不知道咋写看看

博客/报告
🤖 AI/ML

papers | Aligning Large Language Models with Human: A Survey

Sep 2, 2024

数据对齐

LLM
papers
博客/报告
🎇Tech/Tool

Tools | Linux命令行从百度云下载文件到服务器

May 21, 2024

也很慢,但能用

probSolving
tool
🤖 AI/ML

知识图谱 | KG融合-OpenEA实验

May 15, 2024

py3.6有一些版本冲突

KnowledgeGraph
知识融合
过程备忘
🎇Tech/Tool

Tools | git 101

Apr 25, 2024

git从零到一

tool
过程备忘
Git
🤖 AI/ML

生信 | papers | 生信+大模型

Apr 23, 2024

调研专题
papers
生信
🎇Tech/Tool

Tools | HF被墙替代方案

Apr 23, 2024

提供两种方案:modelscope和镜像站

过程备忘
tool
LLM
probSolving
FUCKUGFW
Git
🎇Tech/Tool

过程备忘 | ssh免密登陆

Apr 23, 2024

1.本地生成一对key;2.将.pub上传到远程主机的authorized_keys

tool
过程备忘
🤖 AI/ML

生信 | 报告笔记 | 2024.4.12 生物大分子语言的AI解析与设计

Apr 12, 2024

说实话没咋听懂…和空间转录组交叉不大

生信
meeting
报告笔记
博客/报告
🤖 AI/ML

生信 | papers | 基于空间解析转录组数据对空间聚类方法进行基准测试

Mar 28, 2024

研组布置的文献阅读任务。。。啥也不会

生信
papers
🤖 AI/ML

LLM | (小白向) hf模型页的各种文件是啥

Mar 28, 2024

LLM纯小白向-1

LLM
🤖 AI/ML

LLM | 关于llm的tokenizer

Mar 25, 2024

LLM
🤖 AI/ML

Foundation | 关于overfitting

Mar 24, 2024

过拟合—本质

DLBasic
🤖 AI/ML

papers | Grokking of Hierarchical Structure in Vanilla Transformers

Mar 24, 2024

过度训练让中度模型「涌现」结构泛化能力('fake it till you make it)

LLM
博客/报告
🤖 AI/ML

LLM | Re:从零开始的预训练~1b模型

Mar 23, 2024

分享会记录

LLM
过程备忘
🤖 AI/ML

Meeting | GTC 2024 Notes

Mar 19, 2024

记录

LLM
meeting
GPU
博客/报告
AI-Infra
🎇Tech/Tool

过程备忘 | 将Devcpp的gcc配置到系统环境变量

Mar 14, 2024

重装系统,重装devcpp发现cmd没法用gcc/g++,不方便命令行编译,需要重新写进环境变量

过程备忘
win
🤖 AI/ML

Foundation | HandsOnDL-pytorch

Mar 8, 2024

对torch的tensor操作等再熟悉一下,为手撕系列开坑做准备

DLBasic
Daily
code
🎇Tech/Tool

ProbSolv | vim粘贴缩进错乱

Feb 29, 2024

进入粘贴模式

probSolving
过程备忘
🎇Tech/Tool

Tools | curl下载魔搭指定文件

Feb 28, 2024

在有单一模型文件损坏时很好用的这个方法

tool
🎇Tech/Tool

ProbSolv | docker daemon重启报错起不来

Feb 28, 2024

reload一下

probSolving
Docker
🤖 AI/ML

Meeting | 华为推理交流 - 910b & 新卡 800I A2

Feb 26, 2024

meeting
GPU
博客/报告
AI-Infra
🎇Tech/Tool

ProbSolv | conda报SSL错误

Feb 26, 2024

一种可能是开梯但是conda镜像设置了国内,还有可能是相反

probSolving
过程备忘
🎇Tech/Tool

ProbSolv | git clone报错gnutls_handshake() failed

Feb 26, 2024

代理设置出错,只需重置代理即可

Git
ProbSolving
🤖 AI/ML

CV | ViT & ViViT & DiT

Feb 23, 2024

看Sora顺带看这个,不然看不懂

CV
调研专题
🤖 AI/ML

LLM | Gemma

Feb 23, 2024

据说性能很强悍

LLM
New
调研专题
🤖 AI/ML

CUDA | 博客阅读-Optimize Matmul Kernel

Feb 19, 2024

先看着点,等闲了系统学下CUDA编程

code
GPU
CUDA
博客/报告
AI-Infra
🤖 AI/ML

LLM | CloseAI-Sora初步了解

Feb 17, 2024

文生视频模型,感觉pika要凉……

LLM
Daily
New
🎇Tech/Tool

ProbSolv | win进行ssh连接和scp的坑

Feb 11, 2024

win干这种事好麻烦

Daily
tool
probSolving
🤖 AI/ML

EXP | 实验-LLM-QAT

Feb 5, 2024

LLM-QAT论文的实验+KDTrainer实现细看

LLM
调研专题
🤖 AI/ML

Tools | pycallgraph

Feb 4, 2024

一个函数调用可视化工具

tool
GPU
AI-Infra
🤖 AI/ML

GPU | GPU虚拟化:直通 & vGPU

Feb 4, 2024

GPU的虚拟化方法

GPU
AI-Infra
🤖 AI/ML

GPU | A800 PCIe和SXM4的区别

Jan 29, 2024

另外附上PCIe不同lanes的速度

GPU
AI-Infra
🎇Tech/Tool

ProbSolv | 惠普战66三代Intel版升级win11

Jan 27, 2024

坑爹的阉割版没法开tpm

probSolving
过程备忘
Daily
🎇Tech/Tool

CodeBank | 我的工具代码库

Jan 25, 2024

一些写过的数据处理、可视化、工具代码

tool
code
🤖 AI/ML

Foundation | Gradient Explosion

Jan 24, 2024

梯度裁剪—应对梯度爆炸的方案

DLBasic
🤖 AI/ML

Take a Look | LLM Quantization

Jan 24, 2024

主要看量化感知训练和ft,后量化不做重点

LLM
调研专题
LLMquantize
🤖 AI/ML

papers | RoSA

Jan 19, 2024

RoSA:一个新的低秩微调方案

LLM
papers
🤖 AI/ML

papers | FlexGen

Jan 19, 2024

见过两次了,通过它了解一下prefill的概念

LLM
调研专题
🎇Tech/Tool

Tools | nvidia smi 监控矩阵

Jan 19, 2024

rxpci txpci等

GPU
tool
AI-Infra
😎 Daily

乐理 | 五度圆&和弦轮盘

Jan 19, 2024

一点点即兴伴奏基础(?)

Daily
🤖 AI/ML

LLM | LLM Learning Map(施工中)

Jan 19, 2024

LLM Map

LLM
🎇Tech/Tool

ProbSolv | bash换到zsh原有命令没了

Jan 17, 2024

zsh大法好

tool
probSolving
🎇Tech/Tool

Tools | nvidia软件栈版本查看

Jan 17, 2024

Nvidia 驱动版本 cuda版本查看

tool
GPU
DLBasic
AI-Infra
🎇Tech/Tool

过程备忘 | Docker镜像制作流程记录

Jan 16, 2024

记录一下吧,以后应该还会用到

过程备忘
tool
🎇Tech/Tool

Tools | hf镜像站+huggingface-cli

Jan 16, 2024

解决huggingface被墙

LLM
probSolving
tool
FUCKUGFW
🤖 AI/ML

Foundation | 神经网络BP算法深入理解

Jan 15, 2024

back-propagation

DLBasic
🎇Tech/Tool

Tools | cuda.memory_reserved()查看显存&visualize

Jan 11, 2024

PyTorch使用缓存分配器来加速内存分配。缓存分配器中未被占用的内存,nvidia-smi也显示为使用

LLM
GPU
DLBasic
AI-Infra
🎇Tech/Tool

Tools | iterm2

Jan 9, 2024

iterm2基本用法、profile配置、sshpass配置

tool
过程备忘
😎 Daily
Thoughts

Thoughts

Jan 8, 2024

不知

Daily
LLM
GPU
🤖 AI/ML

papers | ZeRO-Offload: Democratizing Billion-Scale Model Training

Jan 8, 2024

为了降低显存占用,将部分数据和计算放到CPU上

papers
GPU
LLM
AI-Infra
🎇Tech/Tool

ProbSolv | pip not found

Jan 5, 2024

更新pip和apt

probSolving
🎇Tech/Tool

Tools | Tmux

Jan 3, 2024

一些基本和进阶用法

tool
🎇Tech/Tool

过程备忘 | vllm/tgi部署流程

Jan 2, 2024

vllm和tgi框架进行推理性能测试

过程备忘
LLM
tool
🎇Tech/Tool

ProbSolv | nvidia-smi NVML/driver版本不对

Jan 2, 2024

重装驱动

GPU
probSolving
AI-Infra
🎇Tech/Tool

ProbSolv | VSCode连服务器无权限新建/修改文件

Jan 1, 2024

一个小问题,sudo chown -R即可

probSolving
🤖 AI/ML

Meeting | Dec 25,2023 浪潮技术交流

Dec 25, 2023

说了一下目前市场上推荐的卡,及限令之后的训练替代方案L20多一

GPU
meeting
AI-Infra
🤖 AI/ML

papers | Reducing Activation Recomputation in Large Transformer Models

Dec 21, 2023

NV的论文,晓慧姐放在issue上的;提出了sequence parallelism

GPU
LLM
papers
AI-Infra
🎇Tech/Tool

Tools | Docker

Dec 20, 2023

docker使用 很全

tool
🤖 AI/ML

Foundation | Softmax with Temperature

Dec 19, 2023

模型蒸馏论文第一次提出的带有温度的softmax,为了保持类别之间的相关性的信息

DLBasic
LLM
🤖 AI/ML

papers | Distilling the Knowledge in a Neural Network

Dec 19, 2023

模型蒸馏的始祖论文

LLM
DLBasic
papers
🎇Tech/Tool

papers | Adaptive Mixtures of Local Experts

Dec 15, 2023

MoE的元老级paper,探讨了合作和竞争的损失函数,提出了gate network选择一个专家

LLM
papers
🎇Tech/Tool

ProbSolv | fabricmanager与驱动版本不匹配导致cuda.is_available为False

Dec 14, 2023

A800遇到2次了,是因为nvidia-fabricmanager自动升级了,降级成匹配的驱动版本就行

GPU
probSolving
AI-Infra
🤖 AI/ML

Meeting | GPU Foundations分享会记录(未整理)

Dec 14, 2023

xiwang

GPU
meeting
AI-Infra
🤖 AI/ML

Take a Look | Mixtral 8x7B

Dec 13, 2023

mistral新的MoE模型,据说很强

LLM
调研专题
🤖 AI/ML

Take a Look | AI Agents

Dec 13, 2023

Agents的调研

LLM
调研专题
🤖 AI/ML

Basic Nouns | LLM&other(持续更新)

Dec 13, 2023

基础名词解释

LLM
DLBasic
🤖 AI/ML

Take a Look | Sparse Tensor Core

Dec 13, 2023

NV-ampere架构的Sparse方案

LLM
GPU
调研专题
AI-Infra
🎇Tech/Tool

【Tools】

Dec 13, 2023

一些tools备忘

tool
👾CSBasic

Prev | PyQt5两个界面之间的数据传递

Oct 3, 2022

操作系统课设-死锁环路

Algo
Prev
👾CSBasic

Prev | 百度松果算法题-week1

Sep 6, 2022

好几道 easy题

Prev
Algo
👾CSBasic

Prev | OS Experiment 4

Jul 9, 2022

现在看都忘了

Prev
Algo
💻 Profile
DXD
AI/ML Enthusiast
Where there is a shell,there is a way.
🌟 Service
💬 Contact
github
email
linkedin